WIE ITE 


۶ 





5 E 
," n e 
5 
۰ - 
" E 
M ` P 5 
Eg 
d 
0 e 
* 
2 A ۰ 
` 5 E 
Bu 
" E 
0 La 
P " 
" bd E 9 
- LN 5 8 
EE 0 5 
a B A- » hd 0 
Á è - 
` 5 
0 0 و‎ 5 
` ١ | P & 
o | * ES 
LE " .د‎ E " 5 5 E 
B 
E D e < ~ D a 
= Is M "Ud " 3 
= = -Er M 
53 - » 
0 i 4 ب«‎ © 
5 g * = 
` UT .هد‎ 0 35 c 
5 m - 
Am h 
Li .. LE 
E - 00 - E "P 
EJ » LS ar 5 PAA EN 
bl 
~- | . F " 
LS IIS 8 
E] 
i 2 
Lu 
B Cai ”a 
=. JA m 
- . P 
0 
۰ “ی‎ 7 » 
CS T 
` f P 5 I 
0 5 - j à 7 
E - 5 
B B M س‎ 
EI 5 [E m 5 5 
- bed E E 5 
a To : - m 
i E -s | - 
s EI 
E E 
5 5 ص‎ n B 
m "- 
9 A - "^ a 
La | 5 7 
. B » " | P 








EE 1. 
OT 


a 


البيانات الكبيرة. والبيانات 02-5 م التحتبية للبيانات, 
ax PERI‏ المترتبة "T‏ 


0 
00 - 
I v 
*. 
- v : 
E ر‎ 5 
yp * : 
E 
. EN 
A O 
A 5 s ١ 
: TEL 
t l 0 
j "-—— n e 
0 | ات‎ 
d ا‎ 
| "* v - 
` - a 


» 
د‎ = 
Ed ا‎ 
0 7 . , 
0 | á * ^ 
2) . 0 
& ^ e "ا ك,‎ 
r + AzA G Î 
- A LJ 
a . m 
0 ` ر‎ , 
3 m x 
١ 1 LR 
d - 
"(2 a : 
3 T «v 
٠ ^ 
5 ٠ » 
- 
"uz 
LI 
35 05 
0 
: 07 
5 " 
"n 
Bl 0 r 
D 
8 `~ 0 3 
5 ب‎ 
0 0 La 
v,‘ "" 2 
m ا‎ 0 
D 0 "C ^. » e 
"m . 
LE 9 | MM 
۰ I" 
o". . ^ 
EN BH 
"TI 3 5 
.- 9 
E " 0” 
i 1 A 
"un , 
H 5 "P 
T "F w^ M 
- ^ "D. 
.* T 7 I 
id » ۳ o 
, =" 
P 0 
ل م‎ 

; ۰ 
ب“‎ ©“ 7 
5 a ۴ > La 02 9 
"© . ۷ E e 

T 5 
0 i 7 
e a" A 
s E 
E 4 d 0 


A 


بسع الله الأحمن الرحب 
المكتبة الاقتصادية 


قناة المكتبة على التبليجرام ‏ 884/810|الزنجع 69 





مركز البحوث والدراسات 





تورة البيانات 


البيانات الكبيرة. والبيانات المفتوحة. والبنى التحتية للبيانات. 
والنتائج المترتبة عنها 





ترجمه: د. محمد بن أحمد عروى 





راجع الترجمة: ماجد بن عبدالعزيز البريثن 


eY*VA - 2S EY 





AA 


المكتبة الاقتصادية 


قناة المكتبة على التبليجرام  EcONLIBRARY‏ © 


© معهد الإدارة العامة, 679١ه‏ 
فهرسة مكتبة الملك فهد الوطنية أثناء النشر. 
ثوزة البيانات المفتوحة والبنى التحتية للبيانات» والنتائج 
امترتبة uie‏ / روب كيتشنء محمد بن احمد غرويء ماجد 
بن عبدالعزيز البريثن - الرياضء 615 ١ه‏ ء! 
٤‏ ص؛ ۱۷سم × ٤۲سم.‏ 
q41*-1£-Y10-O :dla5;‏ 
C339 -‏ |- غروي محمد بن أحمد (eo a)‏ ب- البريان: 
ماجد بن عبدالعزيز (مراجع) ج- العنوان. 
٤۳۹/۱۲۷۳ ۰۰٤,1۷ ggo‏ 


رقم الإبداع: ۱٤۳۹/۱۲۷۳‏ 


q41-*-3£-Y10-O :eL 23; 








المكتبة الاقتصادية 


قناة المكتبة على التبليجرام  ECON Y‏ © 


IHE 
DATA 


REVOLUTION 
BIG DATA, OPEN DATA INFRASTRUCTURES 
& THEIR CONSEQUENCES 


Rob Kitchin 


ثورة البيانات البيانات الكبيرةء والبيانات المفتوحة: والبنى التحتية للبيانات» والنتائج المترتبة عنها Y‏ 





AA 


المكتبة الاقتصادية 


قناة المكتبة على التبليجرام  ECONLIBRARY‏ @ 


ول الغ 
البروفيسور روب كيتشن 


هو باحث رئيسي في المجلس (European Research Council) 433: Sgal yoYI‏ 
في جامعة إيرلندا الوطنية في ماينوث. وقد قام بتأليف وتحرير كتب عديدة أخرى ناهزت ثلاثة 
وعشرين كتاباء وكان قد خاز على الميدالية الذهبية للعلوم الاجتماعية من الأكاديمية الملكية 
الأيراندية للعام .7٠١‏ وهو الباحث الرئيسي للحاوية الرقمية الأيرلندية والمرصد البحثي 
لعموم الجزيرة الأيرلندية. 
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قائمة الأشكال الرسومية 


الأسئلة المتعلقة بالأفراد خلال التعداد السكاني الإيرلندي للسكان ما بين ١191- 186١‏ 17 
التقاطع بين أدوات مجاميع البيانات لم بس م 
التوزيع الجغرافي لتغريدات التخوف من امثليّة في الولايات المتحدة الأمريكية een‏ 
المواقع اللحظية لمسار الرحلات الجوية LEER d‏ 
لوحة معلومات مدينة لندن الخاصة بالمركز البريطاني للتحليل العمراني المتقدم s‏ 
مجموعة أدوات التحليلات الجغرافية الصورية التي وضعها المركز الوطني للتحليلات 
الصورية في جامعة ينكوبينج t . (Linkóping University)‏ 
استخدام مجموعة أدوات التحليلات الجغرافية الصورية في بناء الرواية 
N a aA‏ الل 


^ | S Hm 2 Á | 
O IL LLLIILLLLLLLILIIILLLILLLILLILIILLILIIIILLILLILLILLILILILLIILLILILLLLLLLLILIBILLLLLLLILLLLLILIILLILLILILILILIILLLLLII ۵ wA 9 (92 
=. =». 
-— 
حاذ‎ g9 العملىاد مل رنه‎ ' 
——"——"—^————————Q———A———— 9 yaoi مر نا ردو ئ‎ 
e 9 e w e 


ثورة البيانات البيانات الكبيرةء والبيانات اممفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 





المكتبة الاقتصادية 


Qh EcONLIBRARY —— usan Lue adio aud 


AA 


المكتبة الاقتصادية 


قناة المكتبة على ECONUBRARY phasi‏ @ 


شكر وتقدير: 

colas‏ نشأة هذا الكتاب في أوائل الشهر السابع (يوليو/ آيار) من العام ۲۰٠۲‏ خلال 
مناقشة بمقهى في أدنيرة مع روبرت روجك (Robert Rojek)‏ 5 5 4$ سایج للنشر 
uS Cu (SAGE)‏ قد اقترحت عليه البحث عن شخص لكتابة مصنف عن اسيانات 
الكبيرة. والبيانات المفتوحة» والبنى التحتية للبيانات» مع تقديم الأفكار وإسداء النصح 
عن ذلك الشخص الذي قد يكون مناسبا لصياغة النص في مثل هذا الموضوع. وكان يرى ف 
حينه أني ذلك الشخص اللمناسب لتلك المهمة. فقررت في وقت لاحق» بعد مضي عدة أشهرء 
الموافقة بين خطط كتاباق والجمع بينهاء بحيث بدأت في صياغة ما بدا في متناول اليد خلال 
فترة زمنية قصيرة جدا ويتناول التحليل النقدي للشهد البيانات المتغير باطراد. تطور الكتاب 
مع مرور الوقت إلى مخطوط كامل يسعى إلى الدراسة المستفيضة للاتجاهات والمناقشات 
الناشئه oto‏ وإنصاف. وبالتزامن مع «AUS‏ بقي روبرت متانعا ا ومصدرا للعديد من 
امواد المثيرة للاهتمام: وكانت مساعدته موضع تقدير كبير جدا. وق سايج Lal‏ ساعد زميله 
(Keri Dickens) x55 ($55‏ 3( !)34 بالكتاب إلى عملية الإنتاج والنشرء التى تم توجيهها 
على نحو مثير للإعجاب (Katherine Haw) gl (5 555 (L3 ys‏ 


(Tracey P. Lauriault) 5: jV .«» (545 5s (Martin Dodge) e335 55b eL 8 

بقراءة مفصلة ونقد هادف للمخطوط بالكامل وعلى نحو متناه فقي السلاسة واللطف. وقام 
(Mark Boyle) Jos eL‏ بقراءة كامل المسودة الثانية» كما قدم غافن Gavin) JK‏ 
6 خع]) واإيفلين روبيرت (Evelyn Ruppert)‏ نقدا مفيدا ليعض فصول الكتاب» وإضافة 
لذلك شارك عدد من الزملاء والأصدقاء في مداخلات نافعة ومناقشات مفيدة. حيث دلني العديد 
منهم إلى مواد ذات صلة؛ منهم مارك غراهام (1313112 813116): 5555 5— ,553 Taylor)‏ 
«(Matt Zook) 355 Ls «(Shelton‏ مات ويلسون (Matt Wilson)‏ ليف مانوفيتش (1.,67آ 
.)Manovich‏ سيان اوکالاھان «(Cian O'Callaghan)‏ سونغ - 655 Sung-Yueh) e3;»‏ 
(Aileen O'Carroll) Jg ogl gbl (Perng‏ جین $2( (Jane Gray)‏ ساندرا كولينز 
(Sharon Webb) «55 5s; L5 (John Keating) 5 5s2 (Sandra Collins)‏ جوستين 
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تمهيد 


Eoghan) 3) 5 5 £s ((Aoife Dowling) zJsl» c» أو‎ (Justin Gleeson) 5s 4l 
جان‎ «(Tim McCarthy) (3) «5 «(Martin Charlton) 5525 L 25 مارتن‎ (McCarthy 
JL ljo (Alan Moore) 5ss 5Vl «(Rob Bradshaw) روب برادشو‎ (Jan Rigby) ریجبی‎ 
تلقیت ;1593 مضدة أنضًا‎ 6$ .(Jim White) c5ls e235 (Darach Mac Donncha) دونشا‎ 
خلال العروض التقديمية في جامعة دورهام» وجامعة كلارك» وجامعة هارفارد. واهتمت رونا‎ 
آعمال المكتب عندما كنت‎ 8)l3b (Orla Dunne) ġlə Yyslş (Rhona Bradshaw) برادشوو‎ 
أحاول الانكباب على إجراء البحوث وكتابة الفصول. كما تفضلت جوستين جلسيون (5]11ا‎ 
بإنتاج بعض الرسوه البيانية. فأنا مدين لكم جميعا بالعرفان. كما أود أيضا شكر‎ 
الكثير من الناس المشاركين على موقع التواصل الاجتماعي - التويتر وتغريداتهم التي أشارت إلى‎ 
الشكر موصول‎ dels alo Col مواد مثيرة للاهتماة» وانخراطهم في مناقشات علمية دقيقة‎ 
إلى كورا (0658©) التي قامت بتثبيتي وقدمت دعما رائعا لي.‎ 

وتم دعم جزء من الأبحاث التي أجريت في كتابة هذا الكتاب من خلال جائزة المجلس 
الأوروبي للبحوث المتقدمة: "المدينة اممرمجة" ERC-2012-AdG-323636; WWW. Ui.)‏ 
(108©11م/16) والتمويل المقدم من هيئة التعليم العالي في برنامج البحوث في المستوى 
الثالث للدورة الخامسة؛ والذي يهدف إلى إنشاء حاوية رقمية لأبرلندا. 

ويمكن الاطلاع على نسخة من مراجع الكتاب من خلال الرابط التالي: http://‏ 
23 .1101001011655 كما يجري بانتظام إضافة مصادر 
للمعلومات وتجارب حول ثورة السانات ع uljllط http://www.scoop.it/t/the-‏ 
«s dos .programmable-city‏ فإن التعليقات والردود مرحب بها من خلال البريد 
الإلكتروني Rob.Kitchingnuim.ie‏ أو التغريد على حساب موقع التواصل الاجتماعي 
- توبتر robkitchine‏ 


لقد سبق نشر بعض المواد الموجودة في هذا الكتاب على شكل أوراق بحثية أو على 
النشرات اليومية» على الرغم من أنه قد تم تحديثهاء وإعادة صياغتهاء والتوسع فيها. ومنها: 
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« Table 3.3 is included with the permission of Michael Hausenblas, 
http://5stardata.info/. 

« Table 4.1 is reproduced with the permission of The Economist. The Economist 
Newspaper Limited, 

« London, issued March 11, 2014. 

٠ Figure 6.1 is reproduced with the permission of Monica Stephens. 

٠ Table 6.1 is reproduced with the permission of Taylor and Francis. 

٠ Figure 6.2 is reproduced with the permission of Flightradar24.com. 

٠ Figure 6.3 is reproduced with the permission of Andrew Hudson-Smith. 

٠ Figures 6.4 and 6.5 are reproduced with the permission of Professor Mikael 
Jern, National Center for 

e Visual Analytics, Linkóping University, http://ncva.itn.liu.se. 

« Table 7.1 Forms of big data corporate intelligence is included with the 
permission of McKinsey & 

e Company. 

٠ Table 7.2 and Figure 7.1 are reproduced courtesy of International Business 
Machines Corporation, © 

e International Business Machines Corporation. 

٠ Figure 7.2 is reproduced from http://ipprio.rio.rj.gov.br/centro-de-operacoes- 
rio-usa-mapas-feitospelo- 

« ipp/ under a creative commons license. 

٠ Tables 10.2 and 10.3 are included with the permission of John Wiley & Sons. 

e Table 10.4 is included with the permission of Ann Cavoukian, Ph.D., 


Information and Privacy Commissioner, Ontario, Canada. 


v‏ ثورة البيانات البيانات الكبيرةء والبيانات ال مفتوحة.ء والبنى التحتية للبيانات» والنتائج المترتبة عنها 


AZ 


المكتبة الاقتصادية 


قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


ملاحظة: 

يعبر عن مصطلح البيانات (102]2) في هذا الكتاب في صيغة الجمع. مع استخدام 
مصطلح وحدة سان cuu (Singular Instance) shl EAI Ae UYU (Datum)‏ ما 
هو موضح في قاموس أوكسفورد للغة الإنجليزية ((181© (Oxford English Dictionary-‏ 

في اللغة اللاتينية: البيانات هي صيغة جمع لكلمة بيان» وتاريخيا وفي المجالات العلمية 
المتخصصة. على الخصوصء يتم التعامل ايضا مع مصطلح «البيانات» للدلالة على الجمع 
في اللغه الإنجليزيهة. حيث gl‏ فی سياق فعل GS (were) ga2J!‏ فى «تم جمع البيانات 
cR‏ 

ومع ذلك. يستخدم هذا ال مصطلح على نحو متزايد في صيغة ال مفرد في وسائل الإعلام 
العامة واطمحادثة اليومية» كما جرى تفصيل ذلك في قاموس أوكسفورد للغة الإنجليزية: 


ومع ذلك فى العموم لا يجري التعامل مع مصطلح «السيانات» بصيغة الجمع في 
الاستخدام غير العلمي الحديث. ولكن بدلا من ذلكء. يجرى التعامل معه كاسم إجمالي - 
للبند غير المعدود - على غرار كلمة «معلومات»»: التى تأخذ الفعل بصيغة المفرد. وأصبح 
من Js AI‏ 3 اللغه الانحليزية القياسسية على مدى عدد من السنوات وعلى نطاق واسع 
الحمل مں قىىل: Q2»‏ جمع à «bL UI‏ سياق فعل ]5,5 «Was»‏ 

لذاء يتبع هذا الكتاب الاصطلاح العلمي المعمول به. ومع ذلكء تم إبقاء yal‏ على حاله 
حيثما اتفق ورود استخدامه dua‏ امفرد عند الاقشاس. ودون الجدل à‏ أي الصغتن هو 
الأصح» فإن انحياز النحاة هو لصيغة فعل الجمع» ولكن الاستخدام العام الشائع هو أكثر 
انفتاحا ومرونه. 
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مقدمه: 

هناك تاريخ طويل للحكومات. والأعمالء والعلوم: وا مواطنين فيما يتعلق بإنتاج واستخدام 
البيانات من أجل رصد العالم: وتنظيمة: والانتفاع منه: وجعلة أكثر منطقا وذا مغزى. وقد 
كانت البيانات في العادة مكلفة وتستغرق وقتا طويلا في الإنتاج والتحليل والتفسير وتوفر في 
العموم صورة ثابتةء غالبا مشوشة» وجزئية عن الظاهرة قيد الدراسة. ونظراً للندرة النسبية, 
كانت البيانات ذات الجودة العالية سلعة ذات قيمةء وعلى هذا الأساس كان التكتم الشديد 
والحرص عليها وتداولها وتبادلها بأثمان باهظة. ولكن هذا الوضع بدأ يتغير بشكل جذري 
تماما. فالبيانات لم تفقد شيئا من قيمتهاء ولكن جرى في نواح أخرى تحول في طبيعتها 
وطرق إنتاجها من خلال مجموعة ما وصفها (1997) AS JA IS SN Christensen‏ 
والتي شكلت تحديا للوضع الراهن في كيفية إنتاج البيانات وإداراتها وتحليلها وتخزينها 
والاستفادة منها. فندلا من أن تكون البيانات نادرة ومحدودة ف قدرة/الوصول إليهاء غدت 
على نحو متزايد طرق إنتاج البيانات كالطوفان؛ سيلا عميقا وواستكا من البيانات المتنوعة 
à‏ طبيعتهاء وا مرتبطة منطقياء وامتوافرة عند الحاجة إليها في الوقت ال مناسب. والمنخفضة 
نسبيا في cll‏ وخارج نطاق الأعمال في طبيعتها. مع تنامي فتحها وازدياد قابلية وسهولة 
الوصول إليها. فثورة البيانات جارية في الوقت الراهن» وهي تعمل بالفعل على إعادة 
تشكيل كيفية إنتاج ا معرفة: وإجراء الأعمال. وحوكمة التشريعات والقوانين. 

لقد تأسست هذه الثورة في الموجة الأخيرة من تقنيات المعلومات والاتصالات »)1٥15(‏ 
وذلك من خلال عدد كبير من الأجهزة الرقمية التى نصادفها اليوم في المنازلء وأماكن 
العملء والأماكن العامة؛ كأجهزة الاتصال ال محمولة» والحوسمة الموزعة» والحوسبة السحابة؛ 
ووسائل التواصل الاجتماعي؛ وإنترنت الأشياء (أجهزة ووسائل استشعار مترابطة ومتصلة 
من خلال الشبكة العاممية -الإنترنت). فهذه الوسائط وال منصات التقنية الجديدة أضحت 
تقود وتوجه أكثر من أي وقت مضى المزيد من جوانب الحياة اليومية - العملء والاستهلاك: 
والسفرء والاتصالء والترفيه - وأضحت العوام التي نعيش فيها تفهم بهيئة بيانات وتسير 
من خلال التقنيات المعتمدة على السانات. وعلاوة على US‏ فإن هذه الوسائط والمنصات 
التقنية الجديدة تعمل ماديا ومنطقيا على إعادة تشكيل طرق إنتاج» وتداول» وتفسير 
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البيانات» وإنتاج ما اصطلح على تسميته «البيانات الكبيرة 0231 818». حيث كميات هائلة 
من البيانات الرقمية المتغيرة وامتنوعة: والتي من السهولة ‏ بمكن الجمع بينهاء وتبادلها؛ 
وتوزيعها من خلال شبكات تقنية ال معلومات والاتصالات» وتحليلها بواسطة جيل جديد من 
Bas (Data Analytics) SLUJI Llas Jll‏ لتتلاءم مع وفرة البيانات على العكس 
من ندرة البيانات ال معتادة. ويتضح حجم طوفان البيانات الناشئة من خلال الادعاء بأنه 
"من فجر الحضارة وحتى العام ۲۴ آنتحت (Exabyte) Cob LaS] duas d ål‏ 
من المعلومات فقط؛ في حين نحن بصدد إنشاء القدر نفسه من البيانات كل يومين" (1121] 
.(Smolan and Erwitt 2012 ja „z~ , Varian, chief economist with Google‏ 

ولا تعد السانات الكبيرة المكون الوحيد لثورة البيانات: فبالأحرى كان هناك العديد 
من المبادرات المتصلة بعضها ببعض من قبيل التحول الرقمي (Digitization)‏ ربط 
وتوسيع مجموعات البيانات المنتجة تقليديا (البيانات الصغيرة) مع بعضها عبر بنى تحتية 
شبكية؛ وحركة البيانات المفتوحة التي تسعى لجعل أكبر قذر ممكن من البيانات متوفرة 
بشكل مفتوح للجميع للاستخذام؛ والهياكل المؤسسية الجديدة التي تسعى لتأمين المبادئ 
التوجيهية والسياسات المشتركة فيما يتعلق بأنماط تنسيق البيانات» ونماذج هيكلتهاء 
والبيانات الوصفية عنهاء وحقوق الملكية الفكرية» وتراخيص الاستخدام القانوني لها ومعايير 
المشاركة بها. وتشكل هذه اطبادرات مجتمعة مجموعة من مجاميع البيانات الجديدة 
- مزيج من نظم الفكرء وأشكال ال معرفة, والتمويلء والاقتصادات السياسية: والتشريعات 
الحاكمة والجوانب القانونية والمادية الناظمة: والبني التحتية» وا ممارسات. والمنظمات 
والمؤسسات. والمجتمعات الم محلية والشخصيات الاعتبارية» والأماكن» والأسواق - التي تؤطر 
لكيفية إنتاج البيانات والحدود القصوى لاستخداماتها ا ممكنة. 

ويظهر أثر البيانات الكبيرة» والبيانات المفتوحة: والبنى التحتية للبيانات بشكل جلي 
في مجالات العلوم» وقطاع الأعمالء والقطاع الحكوميء وال مجتمع المدني. فالتخصصات 
الجديدة التى تم استحداثها بدأت الآن بالتعامل مع تدفق البيانات الهائل بعد التعود 
على العمل في جزر البيانات المتفرقة. والسعي نحو استخراج ا معلومات» واستخلاص النتائج 
من عدد قليل نسسا من المشاهدات (2010 2111168 .[.11). وقد اقترنت هذه التخصصات 


le ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات: والنتائج المترتبة‎ M" 


AA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام ‏ 9ا888/1|الزنجع 9© 


تمهيد 


بمجالات جديدة. مثل علوم البيانات (©561612©6 10262): والحوسبة الاجتماعية (506121 
(Digital Humanities) 4.53,Jl dol uyl aglls (Computing‏ والعلوم الاجتماعية 
(Computational Social Sciences) 4» g—wloJl‏ والتي تعنى بشكل واضح ll elu‏ 
التحتية للبيانات وإيجاد طرق مبتكرة لتحليل وفهم معنى البيانات عند توسعها وكبر 
حجمها. ففي قطاع الأعمالء توفر البيانات الكبيرة وسائل جديدة لإدارة جميع مناحي 
أنشطة الشركة بصورة مرنة وفعالة ويستفاد منها لتحقيق أرباح إضافية من خلال تعزيز 
الانتاجية: والقدرة التنافسية:. والمعرفة بالسوق. كما أضحت السانات نفسها سلعة هامة: 
يتم شراؤها وبيعها مرارا في السوق العالمية بمليارات الدولارات. وبالنسبة للحكومات» وعلى 
نطاق واسع. توفر البيانات الديناميكية المتغيرة رؤى جديدة حول عملياتها. فضلا عن 
إعادة تشكيل وسائل الحكم وتنظيم المجتمع. فمن خلال تفحص قواعد البيانات ال مفتوحة 
يستخلص المواطنون والمنظمات غير الحكومية (81005) النتائج الخاصة بهم» متحدين 
المنظمات التجازية الربحية والأجندات الحكومية» ويقدمون رؤى بديلة للكيفية التي 
ينبغي بها تنظيم المجتمع وإدارته. 

لقد أثارت هذه الفرص الجديدة طفرة حقيقية ملموسة في ما يمكن تسميته ب "تعزيز 
البيانات" (820056611512 1033)؛ من خلال حشد الدعوات امبشرة بفوائد وافاق السبانات 
الكبيرة: والسانات المفتوحة: والبيانات الصغيرة الموسعة. والبمعض من هذه الدعوات له 
ما يبرره» وبعضها الآخر مجرد غث وتهويل dle‏ لا حقيقة له البتة. في المقابل: أصبحت 
مصطلحات: البيانات الكبيرة والبيانات المفتوحة» أنماطا ثقافية قوية في الانتشار والتأثير 
(هيمات 3yo Cug (Memes-‏ وسيلة لوصف اليانات ولكنها رمز لخطاب أوسع مدى 
يستخدم في حشد الدعم لها وانتشار اعتمادها والبدء في تطبيقها. فمع هذا الترويج 
والتعزيز أضحى من السهل الانجراف نحو تبني هذه المصطلحات دون انتقاد أو تمحيص 
للتغيرات التى تحدث والتي أثار العديد منها مخاوف أخلاقيةء ومحاذير سياسية وقانونية. 
ورغم ذلك. فقد كشف التاريخ فيما مضى عن سوابق من الابتكارات المربكة المتعلقة 
بالمعلومات - على سبيل المثال» التحول الجذري في إنتاج المعرفة في أعقاب اختراع الطابعة. 
ومن حيث الواقع: فقد صاحب بداية كل ع صر جديد من العلم تقنيات جديدة أدت إلى 
زيادة مفرطة ف البيانات وكانت بمثابة شرارة التحول نحو طرق جديدة لإنتاج» وتنظيم: 
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وتخزينء: وتحليلء» وتفسي السيانات (2000 1031116011). على سبيل امثال. من ملاحظات 
(Strasser 2012)‏ فإن الاستكشافات في عصر النهضة: والتي تعززت بفعل أدوات علمية 
أفضل في الملاحة. ورسم الخرائطء قد أسفرت عن كميات هائلة من الاكتشافات الجديدة 
التى أدت إلى وسائل جديدة للتصنيفء. وتقنيات جديدة في التحليل والتخزين: وأفكار 
علميه جديدة. 

ونظرا للمرحلة المبكرة نسبيا فى ثورة البيانات الحاليةء فإنه ليس من المؤكد تماما كيف 
ستتكشف وتستقر التحولات الحالية: وما الذي سيكون عليه نطاق عواقب التغيرات التي 
تحدث من منظور أوسع. فالواضح هو أن هناك حاجة ملحة محاولة الإدراك والشعور بما 
يحدث. وهكذاء فإن الهدف من هذا الكتاب هو تقديم إجملي» وتحليل مبدني ودقيق 
للمانات 01181555 1 21 الهارية حالناء فهذا الكتان فی کک 0 یی الطرق 
والوسائل المتعلقة بإعادة تشكيل إنتاج ومعالجة وتحليل وتبادل البيانات» وما يعنيه هذا 
لكيفية إنتاج واستخذام المعلومات وا معرفة؛ وهو من جهة أخرى بمهد للنقاش والتفكير 
النقدي حول البيانات: طبيعتهاء وكيفية تأطيرها من النواحي الفنية والفلسفية والأخلاقية 
والاقتصادية والتجميعات التقنية والممؤؤسسية ال محيطة بها. Yii‏ من أن تتحدد فوائد 
البيانات الكبيرة» والبيانات المفتوجة. والبنى التحتية للبيانات من خلال حالة عاطفية: أو 
نقد لاذع يشجب نتائج العواقب الأكثر سلبية لهاء يقدم الكتاب تقييما نقديا موضوعيا 
للتغييرات التي تحدث. 

ويستند التحليل المقدم في هذا الكتاب على مشاركة واسعة النطاق مما سبقه من 
مؤلفات في مختلف العلوم» والعلوم الإنسانيةء والعلوم الاجتماعية» ومن مطبوعات الثقافة 
duri‏ والإصدارات الصحافية» والدوريات الصناعية: وعلى خبرة مباشرة في العمل على 
أنظمة حفظ أرشيفية وبنى تحشة ومشاريع تحليلات لسيانات على نطاق مؤسسي واسع. 
وينقسم الكتاب إلى أحد عشر فصلا. يقدم الفصل الأول طمحة عامة TU‏ فكريا حول 
مفهوم البيانات وكيفية فهم قواعد البيانات والبنى التحتية للبيانات. ويبحث الفصل 
الثاني في الدور المستمر للبيانات الصغيرة والكيفية التي تم بها توسيع نطاقها إلى أرشيفات/ 
محفوظات رقمية وبنى تحتية: إلى أن وصلت إلى درجة التداول وبيعها من خلال وسطاء 
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البيانات. كما يناقش الفصل الثالث الدافع للتوجه نحو استحداث البيانات المفتوحة 
والبيانات المرتبطة التي يجري تقاسمها ومشاركتها وإعادة استخدامها على نطاق أوسع 
مرور الوقت. ويبين الفصلان الرابع والخامس طبيعة البيانات الكبيرة بالتفصيل وعوامل 
التمكين للبيانات الكبيرة ومصادرها المساعدة على انتشارهاء في حين يقدم الفصل السادس 
طحة عامة عن مجموعة جديدة من تحليلات البيانات التي ترمي إلى فهم البيانات الصغيرة 
الموسعة والبيانات الكبيرة. كما يدرس الفصلان التاليان (السابع والثامن) الحجج المستخدمة 
لتعزيز البيانات الكبيرة والترويج لها وبيان تأثيرها في الحوكمة والأعمالء والسبل التي تقوم 
بها ثورة البيانات على إعادة تشكيل كيفية تصور البحوث وممارستها. ويناقش الفصلان 
التاسع والعاشر التحديات التقنية والتنظيمية: والأخلاقية. والسياسية: والقانونية لثورة 
البيانات. ويحدد الفصل الأخير بعض الاستنتاجات الكلية ويقدم خارطة طريق لإجراء 
امزيد من البحث والتاصيل. 
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يتم فهم البيانات عادة على أنها المادة الخام التي تنتجها طرق تجريد العوالم من حولنا 
والتعبير عنها من خلال فئات: ومقاييس. وأشكال تمثيلية أخرى - كالأرقام, والحروف. 
والرموز» والصورء والأصوات» وامموجات الكهرومغناطيسية» والثنائية الرقمية - تشكل اللبنات 
الأساسية في بناء صروح المعلومات وا معرفة. ومع أن البيانات تعد بطبيعتها مُعبرة ومُمثلة 
للأشياء (على سسل ال مثال» القياسات المتعلقة بظاهرة ما كعمر الشخصء. Aob‏ 4359« لونهء 
haa‏ 11 اا مكان إقامتة. وما إلى ذلك): إلا آنه ا 5ال تون يخا 
ضمنية (مَن خلآل:الغياب بدلا من الوجود)» أو مُشتقة عاى سبيل المثال#البيانات التي يتم 
إنتاجها من البيانات الأخرى كالنسبة المئوية للتغير مع مرور الوقت والتي يتم احتسابها 
من خلال مقارنة البيانات من فترتين زمنيتين مختلفتينء ويمكن أن تكون البيانات مسجلة 
ومُخزنة إما في شكل تناظري 9l (Analog)‏ من خلال ترميزها في شكل رقمي كأرقام ثنائية 
(8115). وتتصف البيانات بأنها ذات جودة جيدة إذا كانت منفصلة وواضحة ممعنى أن 
تكون كل وحدة بيان ås (Datum)‏ ومستقلة وقابله للانفصال» ومعرفة بشكل واضح. 
وتراكمية قابلة للحصر (يمكن أن تبنى في مجموعات)»؛ ومرتبطة ببيانات وصفية لها (بيانات 
عن البيانات)» ويمكن ربطها بمجموعات بيانات أخرى لتقديم رؤى وأفكار غير متوفرة من 
مجموعة بيانات (Rosenberg 2013) &42ls‏ وتتمتع البيانات باستخدام قوي وقيمه 
عالية كونها توفر المدخلات الأساسية لكافة مراحل التحليل التي يجري توظيفها من قبل 
الأفراد. والمؤسساتء وقطاعات العلوم والأعمال لفهم وتفسير العام الذي نعيش فيه. والتى 
تستخده ددورها لاستحداث الابتكارات» اممنتحات» السباسات» واطعارف التي تشكل الكيفية 
التي يعيش بها الناس حياتهم. 

ومن هناء تعذ البيانات موردا رئيسيا في الغصر الحديث. ومع ذلك ونظرا لفائدتها 
وقيمتهاء ومقدار الجهد وا موارد المخصصة لإنتاجها وتحليلهاء فمن اللافت للنظر كيف تم 
إيلاء القليل من الاهتمام للتصور ال مفاهيمي والإدراك المبدئي للبيانات في حد ذاتهاء وف 
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امقابل. هناك الالاف من امقالات والكتب المكرسة لفلسفة ا معلومات والمعرفة. فكما أننا 
نميل في العادة للتركيز على QUA!‏ والأحياء عندما ننظر إلى «oa‏ بدلا من الطوب والإسمنت 
ا مستخدء في بنائها.ء فكذلك هو الحال مع البيانات. وعلاوة على ذلك» وبامثلء كما اعتدنا 
التفكير بالطوب والإسمنت بصفتها مجرد وحدات بنيوية بدلا من عناصر تم تصنيعها داخل 
مصانع من قبل شركات ملزمة ضمن اعتبارات لوجستية ومالية وقانونية» وأنه يتم توزيعها. 
وتخزينهاء وتداولهاء كذلك حالنا إلى حد كبير في التعامل مع البيانات. ونتيجة لذلك. وعندما 
تكون البيانات هي محور التساؤل والاهتمام: عادة ما يتم النظرء بامعنى التقني إلى حد 
كبيرء إلى الكيفية التى ينبغي بها إنتاج وتحليل البيانات» أو الكيفية التي يمكن بها الاستفادة 
منها في إنتاج رؤى وقيم» وليس زيادة النظر في طبيعة البيانات من منظور مفاهيمي 
وفلسفي. 

ومع الأخذ بهذه الملاحظة في الاعتبارء فإن الهدف الرئيسي من هذا الكتاب هو مركب 
Sls VI aX‏ فيه: توفير شرح تفصيلي عن طبيعة البيانات ومجاميعها على نطاق أوسه؛ 
وإيضاح الكيفية التي تتحول فيها هذه المجاميع وتتحور مع تطوير بنى تحتية جديدة 
للبيانات» والبيانات اممفتوحة» والبيانات الكبيرة؛ والتفكير المعمق ف الاثار المترتبة عن هذه 
امجاميع الجديدة للبيانات فيما يتعلق بكيفية استشعرر العام ال محيط بنا والتعاطي معه. 
ولتوفير منهاج مفاهيمي وتصور ٠ «ol aue‏ سيتم في هذا الفصل فحص أنماط البيانات 
وأطرهاء وطبيعتهاء والقواعد الفلسفية لها بالتفصيل. وبعيدا عن كونها وحدات بنيويه 
تسيظة تكفف اللتاققة عن أن البنانات أكثز تق دا مها اكا نظن ففی حين يقبل 
العديد من المحللين البيانات على ظاهرهاء ويعاملونها كما لو أنها محايدة وموضوعية 
وقابله مسقا للتخمين والتحليل في طبيعتهاء إلا أن البيانات مؤطرة فى الواقع من الناحية 
الفنية» والأخلاقيةء والاقتصادية. والزمانية: وال مكانية: والفلسفية. فالسانات لا ممكن أن 
توجد بشكل مستقل عن الأفكارء والآدوات: وال ممارسات: والسياقات: والمعارف ال مستخدمة 
لإنتاحهاء ومعالجتها. ds (Bowker 2005; Gitelman and Jackson 2013) ULJs5s‏ 
فإن الححة i AR‏ هي أن فهم البيانات وثورة البيانات الجارية Wl‏ يتطلب تخلبلا E‏ 
دقه من ذلك الذى تستعرضه الكثير من الآدبيات ذات الصلة بالسانات ال مفتوحة والبيانات 
الكبيرة في وقتنا الحاضر. 
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ماهية السانات: 
بشكل اشتقاقيء فإن كلمة البيانات «1(2683» مشتقة من الكلمة اللاتينية «ع1(0201». 
التي تعني «أن تعطي». وبهذا المعنى فإن البيانات هي عناصر خام يمكن استخراجها من 
أو تعطى بواسطة ظاهرة معينة يجري قياسها وتسجيلها بطرق مختلفة. ولكن البيانات 
تشير في الاستخدام العام إلى تلك العناصر التي تؤخذ وتستخرج من خلال الملاحظات: 
والحسابات» والتجارب» وحفظ السجلات (2007 801812311). أما من الناحية الفنية: 
فما نفهمه من بانات أنها في الواقع التقاطات «22]62» والمشتقة من الكلمة اللاتينية 
«616م03»: والتي تعني «الأخذ»؛ أي تلك الوحدات من البيانات التي تم اختيارها 
وانتقاؤها من مجموع كل البيانات المحتمل4 (2011 .)Kitchin and Dodge‏ كما قال 
Becker 1952: 278) Jensen ja yui „ix :1950)‏ : 
كان حادثا à là usa‏ التاريخ أن يستخدم المصطلح «Datum» L5‏ بدلا من 
«Captum» 43 ellas‏ للدلالة على وصف وحدة الظاهرة ني العلوم., وهی 
ليست المناولات العلمية التى منحتها الطبيعة للعالم: ولكن المناولات التي أخذت 
أو انتقيت من الطبيعة من قبل العام نفسه وفقاً لهدفه. 
من ثم. وبا معنى الدقيق للكلمة: ينبغي على الكتاب أن يعنون بثورة اللقطة 
gol 48 «Data» 5I eas 5s «5 zs .«The Capta Revolution»‏ 
ماضلا في da‏ الاستخدام الأكادمي وقطاع الأعمال لتعنى اللقطة ug «Capta»‏ 
من الخلط واللغط أكثر في هذه المسألة فمن المنطقي اممتابعة والاستمرار في استخدام 
مصطلح البيانات «108]8» مع أن اعتماد مصطلح اللقطة «هامه0©» أكثر ملانئمة في 
الاستخدام. وبعد تجاوز تسليط الضوء على جذور الاشتقاق اللغوي لهذا ال لمصطلح. 
فإن هذه المناقشة الوجيزة تبدأ في تسليط الضوء على أن البيانات التي يتم جمعها 
من خلال القياس هي دانما لمجموعة منتقاة من مجموع كل البيانات المحتملة - 
والتى اخترنا التقاطها من كل ا معطيات الممكنة. وعلى هذا النحوء تكون البيانات 
جزئية بطبيعتهاء انتقائية» وممثلة. مع أهمية المعايير ال مميزة ا مستخدمة في التقاطها. 
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وقد لاحظ علماء آخرون أن ما تم فهمه على أنه «البيانات» قد تغير مع مرور الزمن 
وتطور العلم. فقد b (Rosenberg 2013) jı‏ مصطلح «البيانات» استخدم لأول مرة 
باللغة الإنجليزية في القرن السابع عشر. وارتبط كمفهوم إلى حد كبير بالحداثة والنمو 
والتطور cel cm all‏ والطرق الجديدة في إنتاج» وعرضء ومناقشه المعرفه في القرنين 
السابع عشر والثامن عشر والتي انتقلت بعيدا عن اللاهوت» والوعظ والعواطف إلى 
الحقائنق والآدلة واختبار النظرية من خلال التجريىة ;2013 (Poovey 1998; Garvey‏ 
Rosenberg 2013)‏ ومع مرور الوقتء جاء فھم البيانات على أنها سابقة للتحليلء 
وهي ما قبل اتخاذ صفة الواقعية» وتختلف في طبيعتها عن الحقائق» والأدلةء والمعلومات. 
وامعرفةء ولكنها عنصر مؤسس ق تكوين جميع هذه العناصر على الرغم» قي الغالب» من 
اختلاط التعاريف وا مصطلحات المستخدمة في وصف البياناتء الحقائق» الأدلة» المعرفة, 
والمعلومات بحسب ما آشار (Rosenberg 2013: 18) aJl‏ حين ذكر أن: 


الحقائق 55529 4 «(Ontological)‏ والآدلة معرفية (Epistemology)‏ 
والسانات بلاغية «Datum» (L.Jl $25 23535 .(Rhetorical)‏ حقيقة Is‏ 
كما قد تكون الحقيقة في واقع الأمر Ma‏ .. على أن وجود وحدة السان «Datum»‏ 
يعد مستقلا دون أي اعتبار للحقيقة الوجحودية امطقابلة Corresponding)‏ 
(Ontological Truth‏ وعند نفى diil‏ وإثبات عدم صحتهاء فإنها تتوقف 
عن كونها حقيقة. فالبيانات الكاذبة هي بيانات مع ذلك. 

وبحسب المصطلحات/التعابير البلاغية» فالبيانات هى تلك التي توجد قبل النقاش أو 
التفسير الذي بحولها إلى حقائق» وآدلةء ومعلومات (2013 ع190562»1). ومن هذا المنظور 
تحمل البيانات مفاهيم مميزة: فهي تكون بذلك مجردة. ومنفصلة: وتراكمية (يمكن الجمع 
(Rosenberg 2013) (lo‏ وذات معنى مستقل عن الشكلء واللغة.: وامنتج لهاء والسياق 
(معنى» أن تحمل البيانات معناها سواء تم تخزينها بصورة تناظرية (422108) أو رقمية 
(Digital)‏ أو تم عرضها على الورق أو الشاشة أو تم التعبير عنها بأية لغة, أو تم تقييدها 
بأماط محددة غير متغيرةء مثل إشارة عدد الحلقات في جذوع الأشجار لعمر الشجرة والذي 
يكون .(Floridi 2010) (4J lola lass‏ ويؤكد (2008 1101101) أن دعم استقلال السانات 
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قائم على ثلاثة أنواع من الحيادية 4 : (Taxonmic) 4 a2!‏ كون البيانات ت تمل كيانات 
علائقة معرفه Nusa‏ بالنسبة إلى سانات خاصة أخرىئ؛ والطوبوغرافية (Typological)‏ 
لأنه ممكن للبيانات اتخاذ أشكال مختلفة منفصلة بعضها عن بعضء على سبيل المثالء 
الشكل الأساسيء الثانوي: الوصفيء التشغيليء والمشتق؛ والجينية (Genetic)‏ كون البيانات 
تمتلك دلالات مستقلة عن مدى فهمهاء فعلى سبيل اطثال. تشكل الهيروغليفية على حجر 
الرشيد بيانات بغض النظر عن حقيقة أنه عند اكتشافه ١م‏ يمكن لأحد أن يفسرها. 

وفي واقع الأمر ليس كل من يفكر أو يشتغل بالبيانات يحمل هذه النظرة البلاغية 
الضيقة. ففهم البيانات م يتطور مع مرور الوقت فحسب» بل اختلف هذا الفهم بحسب 
منظور الفهم ووجهة النظر للبيانات. على سبيل المثال» أوضح (2008 )۴1٥۲1۵‏ آن البيانات 
من امنظور ا معرقي هي مجموعات من الحقائق» ومن المنظور المعلوماني البيانات هي 
معلومات» ومن منظور الحوسبة التقنية البيانات هي مجموعات من العناصر الثنائية التي 
مكن معالجتها ونقلها إلكترونياء ومن المنظور العام نرهامةذ©) البيانات هي عناصر 
مجردة بتميز واضح وملموس من البيانات الأخرىء ففي الحالة الأولى» توفر البيانات الأساس 
مزيد من الاستدلال أو تشكل الأدلة التجريبية. وفي ال مجموعة الثانية.ء تشكل البيانات 
معلومات تمثيلية /ممثلة ممكن تخزينها ومعالجتها وتحليلها. ولكن لا تشكل بالضرورة 
حقائق. أما في المجموعة الثالثة» فتشكل البيانات المدخلات والمخرجات من الحوسبة ولكن 
ينبغي معالجتها لتحويلها إلى حقائق ومعلومات على سبيل JALI‏ يحتوي القرص الرقمي 
المدمج ((12171) على غيغابايت من البيانات» وهي ليست وقائع أو معلومات بحد ذاتها 
(فلوريديء .)2٠١0‏ في المنظور الرابع» تكون البيانات ذات مغزى لأنها التقاط ودلالة على 
التنوع والتغيير على سبيل المثالء أنماط من النقاطء والحروف الأبجدية والأرقام: والموجات 
الطولية التي تقدم إشارة ممكن تفسيرها. وكما هو مبين أدناه. قد يشمل فهم البيانات 
مناظير أخرى مثل الفهم القائم على اعتبار البانات بناء اجتماعاء أو امتلاك النيانات وجودا 
ميا أو تحميلها مضامين إيديولوجية: أو اعتبارها سلعة يتم تداولها الاتجار بهاء أو أنها 
تشكل منفعة عامة»ء وغير ذلك من اطفاهيم ال موجودة. والنقطة الأساسية هناء أن السانات 
م تكن أبدا ببساطة مجرد بيانات. حيث تختلف الكيفية التى يتم فيها تصور البيانات 
واستخدامها من قبل أولئك الذين يجمعونء ويحللون, ويستخلصون النتائج منها. 
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أنواع السيانات: 

سواء كانت البيانات بطبيعتها قابلة للتخمين (تم التكهن قبل التحقق منها) ومطابقة 
بلاغيا أو لاء فمن الواضح أن البيانات متنوعة في خصائصهاء مما يحدّد بعبارات واضحة 
كيفية التعامل معها وما يمكن القيام به من خلالها. وبصفة عامة» تختلف البيانات بحسب 
النموذج (النوعي أم الكمّي): والهيكل (المنظم: أو شبه المنظم. أو الغير منظم): وا مصدر 
ali ua)‏ أم Bla aua el dito‏ أم عابرة)» والمنتج (رئيسي, أو ثانويء أو (ele‏ والنوع 
(سبانات تأشرية: أو نيانات خاصية: أو بتانات وصفية). 


السانات الكمية (Qualitative Data) à $2! U5U.JIls (Quantitative Data)‏ : 
من المممكن أن تتخذ السانات العديد من الأشكال المادية متضمنا ذلك «Qo s als OD‏ 
والرموزء والصورء والصوت,. والموجات الكهرومغناطيسية: أو حتى الفراغ أو الصمت (فالفضاء 
الفارغ هو في حد ذاته بيانات). وتنقسم هذه البيانات فى العادة إلى فئتين رئيسيتين: 
البيانات الكمية والبيانات النوعية. فالبيانات الكمية تتكون من سجلات رقمية: وبشكل عام 
تكون هذه البيانات واسعة النطاق وتتعلق بالخصائص الفيزيائية للظواهر (مثل الطول, 
الارتفاع: المسافة» الوزنء المساحة» والحجم)» أو تكون تمثيلية وتتعلق بالخصائص غير المادية 
للظواهر (مثل الطبقة الاجتماعية. ا مستوق التعليمي: الخرمان الاجتماعي؛ وتضنيفات 
مستوى المعيشة). وللبيانات الكمية أربعة مستويات مختلفة للقياس والتي تحدد كيفية 
معالحتها وتحلىلها (1999 «Kitchin and 12e‏ وانظر bal‏ الحدول .)١1-١‏ وممكن تحليل 
هذه البيانات باستخدام العروض امرئية» ومجموعة متنوعة من طرق الإحصاء الوصفى 
والاستدلال» وتستخدم باعتبارها مدخلات للنماذج التنبؤية ونماذج المحاكاة. 
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)١-١( الجدول‎ 


مستويات قياس البيانات 


m التعريف‎ — 


البيانات الاسمية فئوية بطبيعتهاء مع تسجيل المشاهدات 
à (Nominal data)‏ وحدات قياس منفصله. 


البيانات النظامية الترتيبية | ترتب المشاهدات في فئات منظمة. حيث 
(Ordinal data)‏ بعض المشاهدات ھی Si‏ من غيرها. 
بيانات الفترة (أو االمسافة) | تمتد القباسات على طول مقياس يتضمن درجة الحرارة 
(Interval data)‏ الفترة أو المسافة بين نقطة أصل ثابته على المقياس SALI‏ 
وأخرى متغيرة. ولا تتغير طبيعة فترة 
المشاهدات فى هذا النوع من القياسات 
عند الإضافة أو المضاعفة بمقدار ثابت. 





„(Celsius scale) 


وهكن آن تكون قيمة البيانات متضلة 
e)‏ سبيل «JULI‏ الوقت أو الطول) أو 
منفصلة /متقطعة (على Sas JLI Law‏ 
مرات المشاهدة) في الطبيعة. 


البيانات النسبية مماثلة لسانات الفترة عدا أنها ذات | علامة الاختئار على مقباس 
(Ratio data)‏ أنقطة أصل ضفرية حقيقبة: كما أن ا 
امضاعفة بمقدار ثابت لن تغير الطبيعة 
النسسية للمشاهدة. 
Lall gg‏ فإن البيانات النوعية هي بيانات غير عددية؛ مثل النصوصء الصورء الفن؛ 
الفيديوء الآصوات»: وا موسيقا. وبرغم أنه مكن تحويل البيانات النوعية إلى بيانات كمية: 
إلا أن ذلك يتضمن خفضا lo 23g‏ كبيرين وخسارة لثراء البيانات الأصلية نتيجة لعملية 
التحويل. ولذاء فإن عملية تحليل السانات النوعية à nili‏ العادة على المواد الأصلية: M‏ 
لاستخلاص وبناء المعنى والفهم بدلا من إخضاع البيانات ومجرد إمرارها لتقنيات حاسوبية. 
ومع ذلك» فقد تم إحراز تقدم كبير فيما يتعلق معالجة وتحليل البيانات النوعية La abs‏ 
من خلال عدد من التقنيات مثل التعلم الالي والتنقيب في البيانات (انظر الفصل السادس). 
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(Unstructured Data) dohi)! pé والسانات‎ (Structured Data) السانات المنظمة‎ 
:(Semi-structured Data) énظنمnلا والسسانات الشه‎ 

البيانات المنظمة هي تلك البيانات التي يمكن تنظيمهاء وتخزينهاء ونقلها بسهولة من خلال 
فموذج بيانات محدد. مثل قائمة الأرقام والنصوص الواردة في حجدول أو قاعدة سانات علائقية 
ذات تنسيق ثابت موحد (على سبيل امثالء الاسم. تاريخ ال ميلاد. العنوان» الجنسء... إلخ). 
ويمكن معالجة هذه البيانات» والبحث فيهاء والاستعلام عنهاء والجمع بينهاء وتحليلها بشكل 
مباشر نسبيا باستخدام حساب التفاضل والتكامل والخوارزمياتء كما يمكن تمثيلها صوريا 
باستخدام أشكال مختلفة من الرسومات البيانية والخرائطء ومعالجتها بسهولة من قبل 
أجهزة الحاسب الآلي. أما البيانات الشبه المنظمة فهي بيانات ذات تنظيم/ هيكل فضفاض 
وليس لها نموذج أو مخظط مسبقء ومن ثم لا يمكن تقييدها ضمن قاعدة بيانات علائقية. 
وتكون obl dco‏ الشبه اللنظمة غير متسقة: وضظنية» ومرنة:#وَكَالبا ما تتداخل في 
Sha di za de gaze giai csl] coli i iSo «up S b olo d à‏ كبير من 
حقول البيانات. ويتم تمييز كل منها بوسم مميزء ومن ثم يمكن فصل ال محتوى بصورة دلالية 
وتوفير بيانات وصفية ذاتية التعريف بصورة مرنة واستخدامها وسيلة لفرز وترتيب وهيكلة 
البيانات. ومن الأمثلة على البيانات شيه ال منظمة صفحات الويب ال موسومة بلغة التوصيف 
اموسعة (11لغ Äl olaia | 125 (Extensible Markup Language-‏ تستخدم لغة 
التوصيف الموسعة )١۷N[(‏ لتنسيق وترميز المستندات بصورة قابلة للقراءة آلا à b sue‏ 
ان ‘Franks 2012 1321s‏ انظر البيانات ال مرتبطة في الفصل الثالث). 


في المقابلء لا تمتلك البيانات غير المنظمة نموذج بيانات محدّدا أو هيكلا تعريفيا مشتركا. 
ولكن قد يكون لكل عنصر على حدة شكل أو هيكل محدد خاص به؛ مثل عناصر النص 
الروائي أو الصورة: ولكن ليس كل البيانات ضمن مجموعة البيانات لها الهيكل نفسه. 
على هذا النحوء وبينما يمكن à‏ الغالب البحث والاستعلام عن البيانات غير ا منظمة» إلا 
أنه ليس من السهل الجمع بينها وتحليلها باستخدام الحاسب الآلي. وتكون البيانات غير 
المنظمة نوعية بطبيعتهاء ولكن من الممكن ف آغلب الأحيان تحويلها إلى سانات منظمة 
من خلال الفرز والتصنيف. وحتى وقت قريب CMT‏ كانت مجموعات البيانات الكبيرة 
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جدا تحوي في العموم بيانات منظمة كونها أسهل بكثير في المعالجة والتحليل والتخزين 
على هذه الحال. آما ف عصر البيانات الكبيرةء فقد تكونت العديد من مجموعات البيانات 
الضخمة التي تحوي بيانات شبه منظمة أو غير منظمة: مثل التي أنتجتها المشاركات 
الاجتماعية الجماعية على مواقع التواصل الاجتماعي مثل الفيسبوكء التغريدات على تويتر 
الصور ومقاطع الفيديو المرفوعة على الشبكة العاطيةء والمدونات (81085).: S|‏ تشير بعض 
التوقعات إلى معدل زيادة في نمو هذه البيانات غير المنظمة أو الشبه المنظمة بمقدار خمسة 
عشر ضعفا عن السانات المنظمة (2012 .21 )© 5هاناهم7110). وقد صاحب ذلك تطودٌ 
في تصميم قواعد البيانات مثل Y ilg (NoSQL) LSI gé OLLI selg‏ تستخدم 
النماذج الجدولية أو قواعد البيانات العلائقية. انظر الجدول رقم 0): وتقنيات التعلم الآلي 
التي تساعد في التخزين والتحليل (انظر الفصل السادس). 


السانات الملتقطة «(Captured Data)‏ والبيانات المستنفدة/ المستهلكة 
«(Transient Data) 8557! UU Jls «(Exhaust Data)‏ والسانات المشتقة / 
المستمدة :(Derived Data)‏ 

هناك طريقتان رئيسيتان لإنتاج البيانات: الأولى هي أنه من الممكن الحصول على 
البيانات بصورة مباشرة من خلال شكل من أشكال القياس مثل الملاحظة:» وا مسح اطيداني: 
والتجارب ال مخبرية والميدانية» وحفظ السجلات (على سبيل المثال. ملء الاستمارات أو كتابة 
المدونات)»ء والكاميرات» وا ماسحات الضوئية: وأجهزة الاستشعار. وفي هذه الحالات» عادة 
ما تكون البيانات هي ال منتج المطلوب للقياس؛ أي أن النية هى إنتاج بيانات مفيدة. وفي 
المقابلء يتم إنتاج البيانات المستنفدة بالأصل بواسطة جهاز آو «elis‏ وتكون ناتج وظيفة 
رئيسية وليست امخرج الرئيسي (2011 jhe olb JULI Jaw leò .(Manyika et al.‏ 
تسجيل الخروج الإلكتروني امصمم لاحتساب إجمالي البضائع التي تم شراؤها ومعالجة 
عملية الدفع لها من الممكن أن ينتج كذلك بيانات تستخدم لراقبة ال مخزونء وأداء العاملينء 
وعمليات شراء العملاء. وتنتج العديد من الأنظمة المحوسبة مثل هذه البيانات المستنفدة 
والتي أصبح الكثير منها bass‏ قىما للبيانات. وق حالات آخری» فإن السانات ال ملستنفدة 
تبقى بيانات عابرة بطبيعتها؛ أي أنه لم يسبق أن جرى فحصها أو معالجتها ولذا فإنه يجري 
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التخلص منهاء إما لأنها ضخمة جدا أو غير منظمة بطبيعتهاء أو مكلفة في المعالجة والتخزين. 
أو أنه يوجد نقص في تقنيات استخلاص القيمة منهاء أو لقلة الاستخدام الإستراتيجي أو 
التکتیکی لها )2012 Franks‏ ;2012 .21 ]© 011105م72110). ومن الأمثلة على ذلك ما ذكره 
Manyika et al. (2011: 3)‏ من أن "مقدمي خدمات الرعاية الصحية.... يتجاهلون 51١‏ 
من البيانات التي ينتجونها (كالفيديوهات ال مسجلة أثناء العمليات الجراحية)". 

9l البيانات الملتقطة والبيانات المستنفدة بيانات «خام» معنى أنه م يتم تحويلها‎ Asóg 
ضمّها مع غيرها من البيانات. وفي المقابلء يتم إنتاج البيانات المشتقة من خلال عمليات‎ 
إضافية من المعالجة والتحليل للبيانات التي تمّ التقاطها. فعلى سبيل المثال. قد تكون‎ 
البيانات هى تعداد حركة الأفراد على أحد التقاطعات المرورية والبيانات المشتقة منها هي‎ 
التعداد الإجمالي أو التعداد لكل ساعة: فالبيانات الأخيرة استمدت من البيانات السابقة.‎ 
وتكون البيانات التي جرى التقاطها في كثير من الأحيان مدخلا إلى نموذج العملية: في حين‎ 
تكون البيانات المشتقة هي المخرج عن نموذج العملية. فعلى سبيل المثال. قد تكون بيانات‎ 
الكثافة المرورية مدخلا إلى تموذج النقل والمواصلات على أن يكون المخرج هو بيانات التوقع‎ 
أو المحاكاة (مثل حساب حركة المرور المتوقعة في أوقات مختلفة أو في ظل ظروف مختلفة).‎ 
ففي حال وجود نموذجء من المرجح أن تضم بيانات التعداد/ الكثافة ال مرورية مع بيانات‎ 
ملتقطة أو مشتقة (مثل نوع السيارة: وعدد الركاب... إلخ) لإنشاء بيانات مشتقة‎ (5,21 
جديدة قد تشكل مدخلا للنموذج. ويته إنتاج البيانات المشتقة لعدة أستباب بما فيها‎ 
الحد من حجم البيانات والتقليل منها إلى قدر مقبول من الممكن إدارته لإنتاج مقاييس‎ 
أكثر فائدة وذات معنى. وف بعض الأحيان» قد تتم معالجة البيانات الأصلية الملتقطة إلى‎ 
مستويات مختلفة من الاشتقاق اعتمادا على الاستخدام المقصود. ويعد نظام وكاله الفضاء‎ 
الأمريكية - ناسا الخاص برصد ومراقبة الأرض من الأمثلة على ذلك حيث يقدم بياناته في‎ 
ستة مستويات تبدأ من البيانات الملتقطة وغير ال معالجةء وتمضى خلال درجات متزايدة‎ 
من مستويات المعالجة والتحليل وصولا إلى مخرجات النموذج القائمة على تحليل بيانات‎ 
.)١1-7 حدول‎ „hsl ‘Borgman 2007) المستوى الأقل‎ 
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الجدول )١-7(‏ 
المستويات الستة لبيانات نظام رصد ومراقبة الأرض الخاص بوكالة الفضاء الأمريكية 


مستوى السانات الوصف 


المستوى dako pé Ollo‏ وغير معالجة بالدقة الكاملة وبالحاله الخام وتحوى 
كافة إضافات انات الاتصالات (على سبل الطمثالء سانات التزامنء 
ترودسه الاتصال» السانات امكررة) 


المستوى الأول أ انات غو فتظمة 454 اة اة الكاملة ولكن:مختوخة Lalaj‏ 
ومذيلة أو متبوعةه بشروحات إضافية» تشمل معاملات معايرة ومقاسيس 
راديوية وجغرافية ومؤشرات تحتسب وتضاف للبيانات في ال مستوى ٠‏ 


ولكن لا تطبق عليها. 


المستوئ الأول ب 


هي بيانات المستوى الأول أ ولكن تم معالجتها إلى وحدات الاستشعار 


متغيرات جيوفيزيائية مشتقة بنفس دقة وموقع مصدر بيانات المستوى 
الأول 


ا مستوى الثالث متغيرات تم تعيينها في مقاييس شبكة منتظمة للفراغ - الزمنء في 
العادة مع بعض ال مكملات والتدقيق على سلامتها 





مخرج النموذج أو النتائج من التحليل لبيانات المستويات الأقل 
(المتغيرات المشتقة من OLL‏ متعددة). 





المصدر: مقتبس من الموقع الإلكتروني على العنوان : 


https://earthdata.nasa.gov/data/standards-and-references/processing-levels 
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(Secondary Data) الثانوية‎ UL! (Primary Data) 45! UI 
: (Tertiary Data) &sGJ! e L.Jls 

يتم إنتاج البيانات الرئيسية (الأساسية) من قبل الباحثين وأدواتهم من خلال تصاميم 
البحوث التي يضعونها. أما البيانات الثانوية فهي البيانات التي يتم إنشاؤها من قبل 
شخص ثم تتاح للآخرين لإعادة استخدامها وتحليلها. وعلى ذلكء مكن أن تكون البيانات 
الأساسية لشخص ما هي بيانات ثانوية عند شخص آخر. أما البيانات العامة فهي شكل من 
أشكال UU UI‏ اطمشتقة. مثل التعداد: E‏ والنتائج الإحصائيةء وتصدر البيانات العامة 
غالبا من قبل الوكالات الإحصاشية بدلا من السسيانات الثانوية لضمان السرية للأشخاص 
الذين تشير إليهم هذه البيانات. على سييل اطثال. يحظر نشر البيانات الأساسية للتعداد 
السكاني الأيرلندي على أنها بيانات ثانوية إلا بعد مائة عام من إنتاجها؛ ولكن يتم الإفراج 
عن السيانات على صورة ملخصات اجمالية وبيانات تصنيفية عامة. ويسعى العديد من 
الباحثين والمؤسسات لإنتاج السانات الأساسية لأنها مصممة eê‏ لاحتياجاتهم الخاصة 
ومركز عليها؛ في حين لآ تتوفر خيارات التضميم هذة لأولئك الذين يقومون على تحليل 
السيانات الثانوية او العامة. وعلاوة على ذلك. على اولئتك الذين يستخدمون السانات 
الثانوية والعامة كمدخلات في دراساتهم الخاصة أن يتوثقوا من صلاحية البحث الأصلي 
وصحته. 

ويجمع الباحثون في كثير من الأحيان بين البيانات الأساسية والبيانات الثانوية والعامة 
لإنتاج بيانات مشتقة ذات قيمة أكبر. على سبيل المثال:» قد تسعى متاجر التجزئة لإنشاء 
مجموعة بيانات مشتقة تدمج بيانات المبيعات الأساسية مع البيانات السكانية الجغرافية 
العامة Ollo oag (Tertiary geodemographics data)‏ عن أي نوع من الناس الذين 
يعيشون ف مناطق مختلفة وا مستمدة من التعداد السكاني والبيانات العامة والتجارية 
الأخرى من أجل تحديد أماكن لاستهدافها بالمواد التسويقية. إن السانات الثانوية والعامة 
ذات قممة لأنها تمكن من اجراء الدراسات التكرارية وبناء مجموعات SÍ bl‏ ددا 
وأكثر ثراء وتعقيدا. وهي تنتج لاحقا مأ أطلق عليه (2012 .اھ )Crampton e‏ مصطلح 
تضخيم البيانات (1111226102م412 103]2) والذي يعني أن الجمع بين البيانات يتيح رؤى 
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أكبر بكثير من خلال الكشف عن الروابطء العلاقات: والأماط التي تبقى خافية في حال 
ظلت البيانات معزولة: ونتيجة لذلكء فإن بيانات السوق الثانوية والعامة هي صناعة 
ممليارات الدولارات (انظر الفصل .)١‏ 


السسانات التأشيرية (12262 «(Indexical‏ الىىانات ائلخاصuة «(Attribute Data)‏ 
والسسانات الوصفىة :i)Metadata)‏ 

تختلف البيانات أيضا في النوع. فالبيانات التأشيرية هي تلك البيانات التي تتيح 
التعريف بالبيانات وربطها بغيرها من البيانات الأخرىء وتشمل معرفات فريدة من نوعهاء 
مثل أرقام جوازات السفر وبطاقات الضمان الاجتماعى» وأرقام بطاقات الائتمانء والأرقام 
التسلسلية المصنعةء ومعرفات الكائن الرقمي» وعناوين الربط الشبكي (IP and MAC)‏ 
وأرقام الشحن وطلبات الشراء» إضافة إلى الأسماء» والعناوين» والرموز البريدية. إن البيانات 
التأشيرية مهمة لأنها تساعد في حصر كميات كبيرة من البيانات غير المفهرسة بعضها مع 
بعض وتتبعها من خلال معرّفات مشتركة: والمساعدة على التمييز بينهاء وضمّهاء وتقسيمها 
وإعادة تجميعهاء والبحث فيها وغيرها من أشكال ال معالجة والتحليل. وكما هو مبين في 
aol JI Lad‏ فقد أضحت البيانات التأشيرية شائعة على نحو متزايد وبصورة متخصصة. 
مما يزيد من درجة الارتباط والعلائقية بين مجموعات السانات. آما السيانات الخاصبية 
فهي بيانات تمثل جوانب من الظاهرة: ولكنها ليست تأشيرية بطبيعتهاء وعلى سبيل ال مثال» 
بالنسبة إلى شخص ماء قد تكون البيانات التأشيرية هي بصمات الأصابع أو تسلسل الحمض 
(DNA) ($95 —Jl‏ 4139 5$5 بيانات الخاصية له مثل العمرء الجنسء الطولء. الوزن. لون 
العينين» فصيلة الدم» وغيرها. مع ملاحظة أن الغالبية العظمى من البيانات التى يتم 
إنشاؤها وتخزينها في الأنظمة هي بيانات الخاصية. 

البيانات الوصفية هي بيانات عن البيانات» ويمكن أن تشير البيانات الوصفية إلى 
محتوى السانات أو مجموعة السانات كاملة. وقد تشمل السانات الوصفية عن المحتوى 
أسماء ووصف حقول بيانات محددة على سبيل المثالء رؤوس الأعمدة في جدول البيانات 
وتعريفات البيانات. وتساعد هذه البيانات الوصفيه مستخدم مجموعة البيانات على 
فهم مكونات البيانات وتركيبتها وكيف ينبغى استخدامها وتفسيرهاء وتساعد في الدمج بين 
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مجموعات البيانات» وقابلية التشغيل البيني وتبادل البيانات بينهاء والاكتشاف» والقدرة 
على الحكم على مصدر البيانات وسندها. أما البيانات الوصفية التى تشير إلى مجموعة 
الببانات كلها فلها ثلاثة أشكال (2004 ©71150). فالشكل الأول يتعلق بالسانات الوصفية 
التوضيحية والتى تشير إلى بيانات التحديد/التعريف والاكتشاف المتعلقة بمجموعة 
البيانات» وتشمل عناصر مثل الاسم» واممؤلف» والناشرء والموضوع.: والوصف. ويتضمن 
الشكل الثاني البيانات الوصفية الهيكلية والتي تشير إلى بيانات التنظيم والتغطية dc gaah‏ 
البيانات. ويحتوي الشكل الثالث البيانات الوصفية الإدارية التي تعكس متى وكيف تم 
إنشاء مجموعة البيانات» وتفاصيل الجوانب الفنية للبيانات» مثل صيغة تنسيق ال ملف. 
ومن الذي يملك وله صلاحية استخدام البيانات. ومن المعايير الشائعة للبيانات الوصفية 
والذي يجمع الأنواع الثلاثة للبيانات الوصفية معيار دبلن كور Dublin Core) (http://)‏ 
2.2258 ويشترط هذ المعيار تمتع مجموعة البيانات بخمسة عشر حقلا 
للبيانات الوصفية هي : العنوان. المنشىء: ا لموضوع: الوصفء الناشرء المساهم. التاريخ. 
النوع» الصيغة: المعرزفء: ال مصدرء واللغة» العلاقة» التغطية / النطاق» والحقوق / الصلاحيات. 
وبرغم أن البيانات الوصفية da‏ أحد المكونات الأساسية لكافة مجموعات البيانات» إلى 
أنه يجري إهمالها في ممارسات دعم الإتاحة وإعادة الاستخدام والمشاركة للبيانات (10268 
uias (Curation‏ من الباحثين الذين يجمعون البيانات الأساسية لاستخدامهم الخاص 
دون مشاركة الاخرين بها. 


(Knowledge) åå xolg (Information) SL-sglzalg (Data) SULJI 
:(Wisdom) والحكمة‎ 

مايوحد الأنواع المختلفة من البيانات التي تم التطرق إليها في الأجزاء السابقة هو 
أنها تشكل القاعدة أو الأساس الذي يقوم عليه هرم المعرفة: فالبيانات تسبق المعلومات. 
وامعلومات تسبق امعرفة. وامعرفة تسبق الفهم والحكمة Adler 1986; Weinberger)‏ 
1. وتتميز كل طبقة من الهرم من خلال عملية التقطير (التقليلء التلخيص والتجريد: 
المعالجة والتجهيزء التنظيم: التحليل» التفسير» والتطبيق) التى تضيف التنظيم» ا معنىء 
والقيمة من خلال الكشف عن العلاقات والحقائق حول العام (انظر الشكل .)١-١‏ 
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وفي حين أن ترتيب المفاهيم داخل الهرم هو لا جدال فيه على العموم» إلا أن طبيعة 
المفاهيم والاختلافات بينها كثيرا ما تختلف بين المدارس الفكرية. فالمعلومات: على سبيل 
«JULI‏ هي المفهوم الذي يفهم على نحو مختلف بين العلماء» فبالنسبة للبعضء ا معلومات 
هي تراكم البيانات ال مرتبطة بهاء وبالنسبة للآخرين هي البيانات إضافة للمعنىء أو الإشارة 
ذات المعنى في ضوضاء البيانات» أو البناء متعدد الأوجه: أو البيانات العامة حيث تم 
إعادة صياغة البيانات الأساسية من خلال نموذج تحليلي. فبالنسبة لعاط الفيزياء» البيانات 
هي مجرد سلسلة من الأصفار والآحاد. أي (81]5) خام؛ وتعد ضوضاء .(Noise)‏ ولذلك 
فإن المعلومات بالنسبة لعاط الفيزياء تتكون عندما يتم تنظيم هذه الأعداد من الصفر 
والواحد في bli‏ متميزة؛ فهذه هي الإشارة المفيدة (2003 826(61 701). فموجات 
الأثير وكابلات الاتصالات هي ممتلئة بال معلومات المتدفقة - كإشارات الراديو والتلفاز 
وال لمحادثات الهاتفية وحزم بيانات شبكة الانترنت - التي تعني أماطا ذات مغزى من 
البيانات ضمن حخزمة أوسع من الضوضاء. وبالنسبة لآخرين. فال معلومات ذات مفهوم 
أوسع. فقد 332 )74 :2010 «(Floridi‏ على سبيل «JU!‏ ثلاثة أنواع من المعلومات : 
(Factual) izlo)! o‏ معلومات تعكس الحقيقة (على سسل المثالء الأنماط. بصمات 

الأصابع: وحلقات جدوع الأشجار). 


:(Instrucional) adeil «‏ معلومات لأجل الحقيقة (على سبيل المثالء الأوامن 


o‏ الدلالية (ع5©1123111): معلومات عن الحقيقة (على سسل امثالء. الحداول الزمنية 
للقطاراتء الخرائطء والسير الذاتية). 
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هرم المعرفة (منقول من 2010 (Adler 1986 and McCandless‏ 





المعرفة 
التحليل التفسير معلومات منظمة 


المعلومات 
Mem‏ عناصر مرتبطة 


DLJI 
التقليص التجريد عناصر مجردة‎ 


فالنوع الأول هو أساسا بيانات ذات معنى» وهو ما يطلق عليه عادة الحقائق. وهي 
البياندات التي يتم تنظيمها وتركيبها ضمن نظام قياس أو مرجع خارجي يوفر بطبيعته 
أساسا لإنشاء ال معنى الأولي الذي يحمل بعض الحقيقة. وتمتد المعلومات أيضا إلى ما 
بعد البيانات والحقائق من خلال إضافة قيمة تساعد على التفسير. وعليه:. أوضح 
)Weinberger 2011: 2(‏ أن : "المعلومات بالنسبة للسبانات» كالنسيذ بالنسبة لحقل 
العنب: استخراج نواتج التقطر اللذيذة! ". ولذا مكن الحصول على هذه القيمة من 
خلال فرز» وتصنيف» وربطء وإضافة ال محتوى الدلالي من خلال بعض الشكل النصي أو 
الصوري والذي يشير إلى شيء ما و/ أو يرشد إلى ما ينبغي القيام به (على سبيل «JU‏ 
الإشارة الضوئية التحذيرية على لوحة معلومات مؤشرات عمل السيارة التي تشير إلى 
فراغ البطارية وحاجتها لإعادة الشحنء 2010 à Lazlo :2002) gu 439 .(Floridi,‏ 
Borgman 2007: 40) Case‏ أن الاختلافات à‏ تعريف المعلومات تتوقف على خمس 
Bus‏ 
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عدم اليقين Uncertainty)‏ أو ما إذا كان شيء ما قد يحد من عدم اليقين 
في تأهيل البيانات لتكون معلومات؛ المادية (Physicality)‏ أو ما إذا كان 
شيء ينبغي أن يؤخذ على شكل مادي مثل كتاب. أو كائنء أو موجات صوتية 
لكلمة خطبيي لتأهل السانات لتكون معلومات؛ البنية / العملية (/111أع5)11 
egar azb OS ISI Lo gf (Process‏ من الترتيبات أو العلاقات؛ القصد والعزيمة 
ISI Lo 9l (Intentionality)‏ کان شخص ما قد آوعز بان شيئا ما تم التواصل معه 
ليتأهل ليكون معلومات؛ والحقيقة (Truth)‏ أو ما إذا كان ينبغي أن يكون 
الشيء نیا ااهل لون ملخا 
وبغض النظر عن كيفية US jpa‏ فقد لاحظ (2010 8101:101) أنه بالنظر إلى إضافة 
المعلومات المعنى إلى البيانات» فهي تكتسب القيمة الربحية كسلعةء غير أنهاء كنوع متميز 
من السلع» تمتلك ثلاثة خصائص رئيسية مميزة (والتي تتميز بها البيانات أيضا): 
:(Non-rivalrous ) sls yè‏ حیث من الممكن لأكثر من مستخدم أن متلك نفس 
ا معلومات دون التأثير على مدى استفادة المستخدمين الآخرين منها (على عكس السلع 
اطادية المستهلكة). 
غير قابلة للاستثناء أو الإقصاء (110121ع<:©-21012): حيث يتم تقاسمها ومشاركتها 
بسهولة ويلزم بذل جهد كبير في السعي للحد من مثل هذه المشاركة (مثل فرض اتفاقيات 
حقوق الملكية الفكرية أو إضافة حواجز الدفع (827502115) قبل الاستخدام). 
التكلفة الهامشبة (0856© 11311281 7610): مجرد إتاحة المعلومات من اطرة الآولى. 
فإن تكلفة الاستنساخ أو إعادة الإنتاج في كثير من الأحيان لا تكاد تذكر. 
ومع التشديد على خصائص كون ال معلومات مورد يتميز بعدم المنازعة وعدم الاستثناءء 
ولآن المعلومات EE.‏ قيمة. تسعى العديد من الكيانات لضطها والحد من تداولها 
والسيطرة عليها ومن ثم زيادة قيمتها. ومعظم هذه القيمة تضاف من خلال العمليات 
التى تفرض خلال دورة حياة المعلومات (2010 510101) والمشتملة على اطراحل التالية: 
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الوجود (0661111616)): الاكتشافء التصميم: التأليف. 
الإرسال (1131151111551012): التشبيكء التوزيع: النفاذ. الاسترجاعء النقل. 


المعالجه والإدارة and Management)‏ cessingداP):‏ الجمع» التحقق» التعديل» 
التنظيم» الفرزء التصنيف» التصفيه» التحديث» التخزين. 

الاستخدام (Usage)‏ الرصد والمراقبهء النمذجة» التحليلء الشرح» التخطيط التنبؤ 
اتخاذ القرارات» التوحصه؛ «esi‏ التعلم. 

ومن خلال المعالجة والإدارة والاستخدام يتم تحويل ال معلومات إلى معرفة أكثر قيمة. 


وكما هو الحال مع جميع ال مفاهيم في هرم المعرفهء وبا مثلء يختلف فهم مفهوم 
المعرفة. فبالنسبة للبعضء المعرفة هي الدراية التى تحول المعلومات إلى تعليمات 
5S e JUL Lu (AsS .(Weinberger 2011: 3)‏ ربط ال معلومات الدلالية إلى وصفات 
وتعليمات (أولاً قم بهذاء ثنم افعل ذلك..) أو نموذج شرظي لإجراءات استنتاجية (إذا 
كان الحال هو كذا وكذا فافعل JIS‏ وإلا افعل هذا) (2010 710:101). فى هذا التأطير 
تكون المعلومات هي البيانات الهيكلية؛ والمعرفة هي معلومات إجرائية قابلة للتنفيذ 
&jyLasos .(Weinberger 2011)‏ آخری» "امعرفة هى الوصفة التي تحول اطعلومات 
إلى الخبز القابل للآكلء بينما البيانات هي العناصر المكونة 3:8( Zelany) "$y.2Jls‏ 
7 منقول عن 2011 117161618»1). وبالنسبة للآخرينء فإن المعرفة هي أكثر من 
مجرد مجموعة من التعليمات ؛ ويمكن أن تكون المهارات العملية: وأبعد بكثير عن مجرد 
وسيلة لمعرفة كيفية إجراء أو تحقيق المهمة: أو النظام الفكري الذي يربط بشكل متسق 
المعلومات مع بعضها البعض للكشف عن صورة أوسع لظاهرة ما. وينطوي إيجاد 
المعرفة على تطبيق العمليات المعرفية المعقدة على المعلومات مثل الإدراك: والجمع 
والتركيب» والاستخلاص» والدمج والتكوينء والاستنتاج والربط. وللمعرفة قيمة أكبر من 
قيمة المعلومات لأنها توفر أساسا لفهم» وتوضيح» ورسم رؤى حول العام» والتى من 
الممكن استخدامها في صياغة السياسات والإجراءات. أما الحكمة: التي تحتل قمة هرم 
امعرفة. فهي القدرة على تطبيق المعرفة برجاحة ورويه. 
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وبرغم أنه لم تتأصّل بثبات علاقة كل أشكال ال معرفة بالبيانات» على سبيل JELI‏ التخمين 
والآراء والمعتقدات» إلا أن البيانات تشكل بوضوح مادة القاعدة الرئيسية لكيفية استشعار 
الواقع والعالم من حولنا. حيث تشكل البيانات المدخلات الأساسية في العمليات مثل 
الجمع» الفرزء التصنيف. المطابقة: التشخيص / التنميط والنمذجة التي تسعى إلى إنشاء 
المعلومات والمعرفة من أجل فهم الظواهر.ء والتنبؤ بها وضبطها والسيطرة عليها. كما 
يمكننا إنتاج البيانات بمرور الوقت وفي أماكن مختلفة من تتبع. وتقييم» ومقارنة الظواهر 
عبر الأزمنة والأماكن والنطاقات. وهكذاء وعلى الرغم من أنه ينظر إلى المعلومات وا معرفة 
إل كونها مفاهيم ذات درجة أغلى وقيمة أكبر. تبقى البيانات: مع ذلك: عنصرا أساسيا مع 
قيمة كامنة كبيرة يجرى إدراكها وتحصيلها عند تحويلها إلى معلومات ومعارف. فالدافع 
المنطقي الرئيسي لخركة البيانات المفتوحة» والتي بحثت في الفصل الثالث» هو القدرة على 
الوصول إلى القيمة الكامنة في مجموعات بيانات القطاعات الإدارية والعامة. 


تأطير البيانات (12262 (Framing‏ 

حتى الآن في هذا الفصلء فقد بدأت بالفعل صياغة البيانات من الناحية النظرية من حيث 
مناقشة أنطولوجبا السيانات (ماهية وجودها). وأشكالها ال مختلفة: وآأين تتموضع داخل هرم 
المعرفة. كما أن هناك عددا لا يحصى من الطرق الأخرى التي جمكن بها فهم البيانات والتفكير 
p‏ على سبيل امثال» من المنظور التقني الخاص بجودة البيانات» وصحتهاء وموثوقيتها. 
ونسبتهاء وقابليتها للاستخدام» وكيف يمكن معالجتها وتنظيمهاء وتقاسمهاء وتحليلها؛ أو 
من المنظور الأخلاقي المتعلق بالأسباب التي دفعت إلى إنتاج البيانات والاستخدامات التي 
يتم توظيفها بها؛ أو من المنظور السياسي أو الاقتصادي والذي يأخذ بعين الاعتبار التصور 
المعياري للبيانات ومواضع الطعن والتنازع والتنافس فيها كمنفعة عامة» ورأس مال سياسي, 
وملكية فكرية. أو سلعة تجارية» وكيف يتم تنظيمها وتداولها؛ أو من المنظور المكاني و/ أو 
الزماني المتعلق بكيفية إنتاج البيانات وتطوير استخداماتها ومحاور تركيزها من قبل الأنظمة 
والمجموعات التقنية: والأخلاقية: والسياسية: والاقتصادية عبر ا ممكان والزمان؛ أو من ال منظور 
الفلسفي الذي يأخذ بعين الاعتبار الطفاهيم المبدئية وا معرفية للبيانات. وسنرجع لاستذكار 
العديد من القضاياء التى تم بحثها في هذا القسم. لاحقا في جميع أجزاء الكتاب المقبلة. 
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المنظور الفني :(Technically)‏ 

في جميع التخصصات. يتم أخذ البيانات بعين الاعتبار من وجهة النظر التقنية المعيارية. 
والسؤال ال مطروح على المحك هو إلى أي مدى تنتج طرق التقاط البيانات وقياسها بيانات 
محددة. ونظيفة؛ ودقيقة» وكيف مكن وينبغى معالجة» وتنظيم» ومشاركة. وتحليل هذه 
السانات بطرق تحافظ على سلامتهاء من أجل ضمان موثوقيتها وصلاحية الاستنتاجات 
ال مستخلصة منها. ولذا كان هنالك دائما شكوك فيما يتعلق بصحة السانات لأنها بطبيعتها 
محردة. وعمومية: وتقرسه عند انتاحهيا (2009 22000611104)). وحيث EUS‏ فقد توجه 
الكثير من الاهتمام إلى قضايا تتعلق مفاهيم تمثيل البيانات (15612]2)116172655مع1 «(Data‏ 
وعدم البقين بصحتها Lass .(Reliability) L4» 4335581l à 2-555 (Uncertainty)‏ : 
اممكنة المصاحبة لها (11101): والتحيز ال منتقص مصداقية دلالاتها (8135).: وا معايرة 
ouaa $ (Calibration)‏ البحوث وتطبيقاتها. وتسجيل هذه ال معلومات كبيانات وصفية. 

وبالنظر للبيانات على أنها علامة بديلة عن بعض جوانب ظاهرة ما - كالضوء هثل نجماء 
والخصائص الفيزيائية التي تمثل مبنى» والكلمات التي تمثل أفكار شخص - يتعلق التمثيل 
(Representativeness)‏ مدى التقاط البيانات لهذه الظاهرة التي تسعى إلى تمثيلهاء وإلى 
أي مدى تمثل عينة البيانات التى تم إنشاؤها المجتمع الكامل للظاهرة. وفيما يتعلق 
بالسؤال السابقء فإن السؤال الرئيسي هو إلى أي مدى يمكن أن نكون على ثقة من أن 
التقنيات العلمية قد التقطت بدقة الظاهرة قبد الدراسة. لقد مثل هذا التساؤل مشكلة 
خاصة في مجال العلوم الاجتماعية والإنسانية وأثبت أنه كان من الصعب حلها. فعلى 
سبيل JELI‏ لوحظ بشكل كبير أن ما يقول الناس أنهم سيفعلون وما يفعلونه في الغالب 
ما يكون مختلفا تماما عن الواقع, وما يفعله الناس في كثير من الأحيان قد لا يقصدونه. 
ولذلك برز سؤال حول امدى الذي تمثله بيانات المقابلة الشخصية للسلوك البشري» أو 
مدى تمثيل الفكر الواعي لهم. وبالمثل. هناك مخاوف بشأن مدى التقاط وتمثيل المؤشرات 
الرئيسية للتعبير بدرجة كافية عن كيفية أداء مجال ما. على سبيل المثال: إلى أي مدى 
تعطي المؤشرات المتعلقة بعدد مرات الاقتباس» ومؤشر إتش (11-1506): وبراءات الاختراع 
المسجلة دلالة على أداء عالي الجودة من قبل موظفي الجامعة (مع الاحترام لأعضاء هيئة 
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التدريس في مجال العلوم الإنسانية فإن هذه المؤشرات تعد سيئة للغاية)؟ ولذا كان الحل في 
محاولة تطوير تصاميم بحثية أكثر تعقيدا لمواجهة أوجه القصور في هذه الأساليب ال مختلفة 
أو تجاهل أوجه القصور المتعلقة بها إلى حد كبير. 

وبالنسبة لما يتعلق بمدى تمثيل عينة لمجتمع دراسة ماء فقد نقررء اعتمادا على خمسين 
نجمة: إنتاج بيانات فلكية هائلة: ومفصّلة: وعلى مدى طويل من أجل فهم أفضل 
لطبيعتها. ولكن إلى أي مدى يمكن أن نكون على ثقة بأن هذه الخمسين نجمة تمثل مجمل 
خصائص امليارات الأخرى من النجوم الموجودة؟ وحتى في عصر البيانات الكبيرة» التي 
تسعى إلى أن تكون شاملة وليست انتقائية في إنتاج البيانات (انظر الفصل الرابع): فإن 
البيانات هى بطبيعتها عينة (فليس كل الناس يستخدمون وسائل التواصل الاجتماعي؛ أو 
يتسوقون باستخدام البطاقات الائتمانية» وبالتأكيد لا يمتلك كثير من الناس في جميع أنحاء 
العام حق الوصول إلى الهواتف وأجهزة الحاسب).: وهذا يعني أن البيانات هي ممثلة 
اجموغة من o Oas gaad] odi EDS ud Las ORCI‏ وؤزة اك کا الحل هو 
ابتكار مجموعة من تقنيات أخذ العينات التي تسعى إلى ضمان التمثيل الدقيق في ظل 
مختلف الظروف (والتي تعتمد غالبا على عينة عشوائية). واستحداث أساليب إحصائية 
تقوم بحساب مدى الثقة التي يمكننا أن نكون عليها حيال تمثيل عينة ما للمجتمع الدراسة 
(Kitchin and Tate 1999)‏ 

وتتعلق الموثوقية بالتكرارية أو الاتساق في الحصول على النتيجة نفسها من توظيف 
à JI‏ البحث. وقد وصف (1997 56112501 320 5X5 (Golledge‏ 4 أنواع من اطوثوقية: 
)١(‏ اطوثوقية التصورئة (quixotic reliability)‏ »3 5583( طريقة واحدة للملاحظة 
والاستكشاف إلى Ai‏ غير متغير باستمرار. (؟) امطوثوقية الزمنية المتعاقبة Diachronic)‏ 
111177 )2 وفيها يكون استقرار الملاحظات عير الزمن. )١(‏ الموتوقبة التزامنية 
(Synchronic Reliability)‏ وفيها يكون التشابه ف الملاحظات خلال الفترة الزمنية نفسها. 
وتعد الموثوقية مهمة لأنه من المسلّم به أنه كلما كان القياس أكثر اتساقا في إنتاج البيانات» 
أمكن بشكل أكيبر وصف هذه السانات بأنها بيانات موثوقة. 
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والخطأً هو الفرق بين القيمة المقاسة والقيمة الحقيقية, ويمكن أن يشمل الغيابات 
البيانات ال مفقودة, والأخطاء مثل الخطأ في الإدخال / الترميز أو الخطأ في التصنيف أو سوء 
تطبيق الأسلوب التقني» وسوء الفهم. آما التحيز فهو نوع معين من الخطأ. حيث تنحرف 
السسانات بسبب نمط ثابت من الخطأ. وعادة ما يحدث التحيز بسي الطريقة: أو الأداة, 
أو أسلوب أخذ العينات المستخدم لإنشاء البيانات والتي لها تأثير مفرط على البيانات التي 
يتم إنتاجهاء أو يمكن تقديمها بسبب موقف إيديولوجي أو تطلعات الباحث في كثير من 
الأحيان بطريقة غير متعمدة (1996 1112ء121). ومن الممكن أن تتسبب آليات ال معالجة 
مثل التجميع أو الإجمال في إحداث تحيز من خلال الحدّ من التباين في مجموعة البيانات 
مما يؤدى إلى أخطاء امغالطة المنطقية للاستدلال البيئي (Ecological Fallacy Errrors)‏ 
بمعنى أنه على افتراض تمثيل القيمة الإجمالية لمجموع الأفراد بدقة على سبيل المثال إذا 
کان لدینا اشتخصین وزنهما 5۰ کیلوجراما وآخرین وزنهما ۱۵۰ كيلوجراما فسيكون متوسط 
الوزن الإجمالي هو٠١٠‏ كيلوجرام» ولكن لا أحد ف المجموعة يزن هذا الوزن في الواقع 
.(Kitchin and Fotheringham 1997)‏ ويتعلق مفهوم عدم اليقين مدى ثقة الباحث 
بخصوص دقة البيانات وأي تحليل قائم على أساسها. آما فيما يتعلق بالبيانات الكمية 
فيتصل بدرجة اليقين بالاختبار الإحصاثي وذلك بالنظر إلى البيانات المدخلةء وعادة تحتسب 
على أساس الاحتمالات ويعبر عنها بمستويات الثقة (2009 14نداء6004). أما مفهوم عدم 
اليقين بالنسبة للبيانات النوعية؛. فيجري في الغالب تقييمه والحكم عليه من قبل خبير بناء 
على الخيرة السابقة. 

وتتمثل دعائم معالجة هذه المخاوف بالإيمان بأن مثل هذه القضايا تنشأ بسبب الضعف 
البشري في تصميم البحث أو أوجه القصور وعدم كفاءة الأدوات وا معدات أو الطرق 
المستخدمة والتي من الممكن التغلب عليها من خلال الحلول التقنية. وهذا يعني أنه من 
الممكن معالجتها عن طريق تحسين نوعية الإجراءات وال معدات المستخدمة. وتطبيق أنظمة 
التوحيد القياسي $S ilg (Standardization - yu iil)‏ معايير جودة البيانات المعروفة 
مشل تلك التي أقرتها ا لمنظمة الدولية للمعايير آيزو (150)»: والتي تعمل على إيجاد سبل 
للتعويض عن عدم اليقين والخطأ والتحيز في وسائل التحليل المستخدمة. 
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المنظور الأخلاقي (2117ء1ط)5): 

الأخلاق معنيّة بالفكر والممارسة المتعلقة بمفاهيم القيم مثل العدالة: وا لمساواة. 
والنزاهة» والصدق» والاحترام» والحقوق» والواجبات» والرعاية. ويعمل كل مجتمع وفق 
مزيج من القيم الأخلاقية الفطرية البديهية والعامية غير الرسمية» المسلم بهاء والمواقف 
الأخلاقية المقنئّة جيدا وامنصوص عليها في قواعد. ومبادئ. وسياساتء وتراخيصء وقوانين 
تخضع للإنفاذ من قبل أجهزة الدولة والوكالات الأخرى. وكثيرا ما تكون هذه المواقف 
الأخلاقية محل نزاع بين مجموعات مختلفة تأخذ وجهات نظر متناقضة عن القيم نفسها 
وإلى أي مدى ينبغي إخضاع اط مواقف الأخلاقية للتشريع القانوني» ومناقشتها كممارسة في 
الفلسفة الأخلاقة. كما يوجد مثل هذا الطعن فيما يتعلق بالبيانات. وخاصة ما يتعلق ما 
يتم إنشاؤه من بيانات ووسائل الإنتاج لهاء وكيفية مشاركة البيانات وتقاسمهاء وتداولهاء؛ 
وحمايتهاء وإلى الحدود التي ينتهي عندها العمل بها. 

ففي حينء تعد بعض البيانات معتدلة TE‏ على سبيل امثال القياسات المتعلقة 
بالطقسء فإن بعض البيانات الأخرى تعد حساسة للغاية: كالبيانات المتعلقة بالأفراد والتى 
يممكن استخدامها لإنتاج صورة مفصلة عن الحياة ا معيشية لهم. وضبط وتنظيم تلك الحياة 
على إيقاع معين. وقد يلحق إنتاج البيانات ضررا في بعض الحالات. على سبيل المثال 
الأضرار التي قد تنتج عن إجراء مقابلات مع ناجين من جرائم الحرب وما قد تتسبب 
فيه تلك المقابلات من ضغوطات نفسية وضيق. وف هذا اممقام» هناك تساؤلات حول 
الممدى الذى من الممكن أن يشكل فيه إنتاج البيانات. ومختلف أشكال اراقبة والترصد 
(Dataveillance) S 5LU‏ أي امراقة والرصد من «LUI Mow hlag dalea JUS‏ 
وتحليل البيانات تعديًا على الخصوصية وحقوق الإنسان الأخرى. وتساؤلات أيضاً حول 
المدى الذي يمكن أن تستخدم فيه هذه البيانات بفعالية لفرز الأفراد اجتماعيا بمعنى تقديه 
خدمات تفضيلية على أساس خصائص الأفراد 85-44 4« )2005 .(Graham‏ وتتعاظم 
هذه ال مخاوف بالنظر إلى سهولة جمع ومشاركة وتداول البيانات الرقمية» ونحن نعيش في 
عصر توليد البيانات ومراقبتها بصورة طاغية وعلى نطاق واسع. ولعله ليس من المستغرب 
بعد ذلك أن وكالات تمويل البحث العلمى ومؤسسات التعليم العالي الآن تقيّم بشكل دورى 
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الأبعاد الأخلاقية للمشاريع البحثية نظرا لآثارها المحتملة على نطاق أوسع, وإضافة لذلك 
فقد سنت الدول تشريعاتء Jio‏ قوانين حماية البيانات وقوانين الخصوصية: في محاولة طنع 
سوء الاستخدام والتجاوزات المسيئة للبيانات. ولقد تم مناقشة هذه المسائل وما يتصل بها 
بشكل مفصل في الفصل العاشر. 


المنظور السياسي والاقتصادي :(Politically and Economically)‏ 
مثل الاهتمام بالمنظور الأخلاقي للبيانات البداية للكشف عن الطرق التي تعمل على 
تأطير البيانات من خلال الاهتمامات السياسية والاقتصادية على نطاق أوسع. وتتعلق 
هذه الاهتمامات ماهية البيانات التي يتم إنشاؤهاء وكيفية معالجتهاء وتحليلهاء وتوظيفها 
بالنسبة إلى: كيفية تضور البيانات وتوصيفها معياريا ضمن المجموعات الشكانية وتوظيفها 
من قبل الدول» ومفاهيم الكيفية التي ينبغي بها تنظيم البيانات وتقنينها؛ والمناقشات التي 
تطرح ضمن مجموعات الاختصاص التي تؤيد أو تعارض إنتاج البيانات وتطبيقاتها؛ واتخاذ 
القرار حول التمويل والاستثمار في البيانات؛ وانتشار الرأسمالية والطرق التى تستخدم 
البيانات لإدارة المساعي وزيادة القيمة والأرباح؛ والتداول للبيانات كسلعة مع ظهور سوق 
للبيانات تقدر قيمته بمليارات الدولارات والتى يشارك فيها مجموعة متنوعة من اللاعبين 
كالمنتجينء المجمّعين» البائعين» ا محللينء والمستهلكينء انظر الفصل الثانى. فمنتجو البيانات 
ينغي عليهم الأخذ بعين الاعتبار الرأي العام والسياسيء والاعتبارات الأخلاقية والبيئة 
التنظيمية والتمويل المتاح وسلامة استثماراتهم إزاء ال موارد. كما ينبغي على أولئك القائمين 
على الساحتين التشريعية والتمويل اطالي أن يكون لديهم سعة الأفق واتخاذ القرارات حول 
كيفية تشكيل المشهد الذي يعمل به منتجو ومستخدمو البيانات: وكذلك النظر ف أنظمة 
العمل المتعلقة بالبيانات الخاصة بهم وما يكشفونه عن جداول أعمالهم وأولوياتهم 

وأساليب الإدارة والحوكمة الخاصة بهم (2012 (Lauriault‏ 

وف كلتا الحالتين» هناك مجموعة متنوعة من العلاقات السياسية والاقتصادية العقلانية 
في المشهد. مع أصوات متنافسة تسعى للتأثير على الرأي ومشهد البيانات على النطاق 
الأوسع. فعلى سبيل ال مثال» فإن حركة البيانات المفتوحة تمثّل البيانات كسلعة عامة تتشكل 
من العموم وتكون فى متناول الجميع بحرية مطلقة باستثناء البيانات الحساسة أمنياء 
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والشخصية الخاصة أو يمكن الوصول إليها من خلال اتفاقيات الاستخدام العادل. وفي 
المقابلء يعرض قطاع الأعمال البيانات كسلعة تجارية قيِّمة تحتاج من جهة إلى الحماية 
من خلال أنظمة ال ملكية الفكرية (حقوق الطبع والنشرء براءات الاختراع» وحقوق ال ملكية) 
ولكن» من جهة أخرى لا ينبغي ربطها بشدة بالمحاذير الأخلاقية التي تمنع من استغلالها 
لتحقيق ال مكاسب امالية. أما بالنسبة للمجتمعات والدولء فالبيانات هي الوسائل التي 
مكن من خلالها تقنين» وممارسة:. ومنازعة الأجندات السياسية والأعمال عبر تمكين بناء 
الإثباتات - أي الروايات اللمسندة والدعوات المضادة التي لها قيمة بلاغية أكبر من مجرد 
التندر أو دغدغه المشاعر )2013 õlg (Wilson 2011; Garvey‏ 45,21 تعد السانات 
بالنسبة لعالم الفلسفة الفرنسي 1981( (Foucaults‏ شكلا من أشكال السلطة / المعرفة؛ أي 
وسيلة يمكن من خلالها ضبط وتنظيم الشعوب» والظواهرء والأقاليم )2012 .(Lauriault‏ 
وتتقاطع هذه الاهتمامات والمصالح البديلة في كثير من الأحيان بطرق متناقضة: من حيث 
أنه قد يكون لها أجندات مختلفة تماماء على سبيل المثال دعم الأعمال التجازية الكبيرة 
لحركة الشانات اللفتوحة قنما تعلق بالساننات العامة (انظر:الفصظلل آلقالك):.وبعبارة 
أخرىء» تظهر البيانات جليا وتتموضّع ضمن الاقتضاذات السياسية المعقدة, وفي الوقت 
نفسه فهي تستخدم لتشكيل مثل هذه القضايا والنظم وا مجموعات. 

وعلاوة على ذلك. تشكل البيانات مورداً اقتصادياء وهي عنصر أسامي في المرحلة المقبلة 
من الاقتصاد القائم على المعرفة. وتعمل على إعادة تشكيل نمط الإنتاج القائم على البيانات 
(انظر الفصل السابع). ومنذ أواخر الثمانيشات :)١19٠05(‏ يرى بعض العلماء مثل Castells‏ 
(1996 ,1988) أن آخر دورة للرأسمالية يدعمها إنتاج ا معرفة التي تنشئ منتجات وأشكال 
عمالة جديدة: وتسهل إعادة الهيكلة الاقتصاديةء وتعزز الإنتاجية والقدرة التنافسية: والكفاءة: 
والاستدامةء وتراكم راس Ass JUI‏ البيانات الكبيرة. على وجه الخصوص» هي أحدث 
التطورات المتعلقة بتعميق وتعزيز هذه الدورةء وتوفير ثورة من الأدلة التي يتم استخدامها 
من قبل الشركات من جهة» لرصد وتقييم آداء الشركة اللحظي» والحذ من الهدر والاحتيالء 
وتحسين إستراتيجية الشركات» والتخطيط وصنع القرار» ومن جهة آخرىء لتصميم glu‏ جديدة 
وتحديد واستهداف اسواق جديدة. وتطسق التسعير المتغيرء وإدراك الإمكانات غير ال مستغلة: 
واكتساب ميزة تنافسية )2012 .)Manyika et al. 2011: Zikopoulos et al.‏ وق سبیل 
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القيام بذلك» يمكن إنتاج وتحليل البيانات من تشغيل الشركات بشكل أكثر ذكاء فيما يتعلق 
بكيفية تنظيمها وتشغيلهاء وتعزيز المرونة والابتكارء والحد من ا مخاطر والتكاليف والخسائر 
التشغيليةء وتحسين تجربة العملاءء وتعظيم العائد من الاستثمار والأرباح. وكقائد لعملية 
تراكم رأس المالء ستسهم البيانات الكبيرة في إيجاد أعمال (وظائف) جديدة وفي الجولة المقبلة 
من التنمية غير المتوازنة». ومن هذا ا منظور يمكن فهم البيانات على أنها وكيل ملصالح رأس امال 
واهتماماته. 


المنظور الزماني والمكاني :(Temporally and Spatially)‏ 
تمتلك البيانات أبعادا زمانية ومكانية على حدّ سواء. حيث تختلف ماهية البيانات التي 
يتم إنتاجها والطرق التي يتم بها معالجتهاء وتحليلهاء وتخزينهاء أو التخلص منها باختلاف 
الزمان وال مكان؛ أي أن للبيانات ومجاميعها المحيطة بها دلالات تاريخية وجغرافية. كما 
تتغير كيفية معالجة البيانات وتحليلها مع مرور الوقت» متأثرة بالتغيرات والتحسينات 
التنظيمية في التعذاد والإدارة. والقوانين الجديدة المتعلقة بتداول البيانات وحمايتها. 
والتقنيات الجديدة. والطرق الجديدة في فرز البيانات وتحليلهاء والاختلافات الإحصائية 
الجغرافية مثل حدود المقاطعة ال محلية أو الوطنية الجديدة: والأسالس الإحصائية الجديدة. 
وعلاوة على ذلكء يمكن مجاميع البيانات التى تسستخدم في ولاية معينة أن تكون مختلفة 
Lau‏ عن تلك التي تستخدم ق أخرى» وحتى داخل حدود الولاية الواحدةء فقد تختلف 
الطريقة التي يقوم فيها كيان ما بإنتاج البيانات وإدارتها بسبب التقلبات المؤسسية أو 

الشنخصه. 


وبالنظر في التعدادات السكانية: يتكون التعداد من مسح شامل منطقة وساكنيهاء 
ويتم إجراء المسح في العادة كل عشر سنوات. والهدف من ذلك هو جمع معلومات 
أساسية حول ال مقيمين في منطقة ما وخصائصهم على سبيل المثال: العمرء الجنس» الحالة 
الاجتماعية: التركيبة الأسرية. الدينء العرق» الطبقة الاجتماعيةء وما إلى ذلك وجوانب 
عيشهم فيها (عملهم» ومكان الإقامةء وما إلى ذلك). ويتطلب تمكين قياس التغيير في 
التعدادات السكانية الاستمرارية فيما يتعلق بالأسئلة المطروحة فيها والكيفية التي تدار 
بها هذه التعدادات. وف ذات الوقت» يتطلب التقاط البيانات الجديدة موضع الاهتمام 
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والتى تعكس تغيرات أوسع ف المجتمع: إجراء تغييرات على آلية هذه التعدادات» مثل 
إضافة أستلة جديدة أو التعديل على الأستلة الأساسية (انظر الشكل :١-‏ ولاحظ كيف أنه 
حتى عندما تم م الحفاظ على الأسئلة عبر التعدادات السكانية المتعاقبة. ALAS Gl‏ صاغتها 
كانت غالبا ما تكون مختلفة تماما في كل مرة). وعلاوة على ذلك. فإن الكيفية التي 
يدار بها التعداد السكاني JS ài calis‏ ق التعدادات المتعاقبة من قبل قوى مؤسسية: 
وسياسسة: واقتصاديةء وتطورات تقنة جديدة : انظر 1991) 1:12612211) للتعرف على 
تاريخ التعداد السكانى الايرلندي Y - VAYYV o‏ 343« و2012) غ1.21111211[1) لتحليل التعداد 
الكندى من .٠١1١١- ١17١‏ علاوة على US‏ يتعرض التعداد للطعن والتفاوض cu‏ 
تتنافس مصالح خاصة لضةء أو تغييرء آو إزالة الأسئلة منها. وف بعض الحالات» مكن أن 
تكون التغييرات المطلوبة جذرية بشكل متطرف» مثل القرار GUI‏ بوقفت إجراء التعداد 
السكاني فى الثمانينات (انظر 2011 طههمة1]). ونتيجة لذلكء يرزح التعداذ الوطني دائما 
تحت وظأة التوتر الناتج عن الاستمرارية والتغيير» ومع ذلك: يتطور مع مرور الوقت وفي 
مناطق جغرافة مختلفة. وحتى الان» ومع ذلك فقد كان هناك عدد قليل من مجاميع 
السانات اطميزة تارد bou‏ وجغر Alder 2002; Desrosiéres 1988; Hannah 2011;) Là‏ 
(Hewitt 2010; Lauriault 2012; Poovey 1998; Porter 1995‏ 
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شكل )١-5(‏ 
الأسئلة المتعلقة بالأفراد خلال التعداد السكاني الايرلندي للسكان ما بين ١141 - 186١‏ 
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المنظور الفلسفي (117[هعتادزه1105ط2): 

بالنسبة للبعضء تعد البيانات على الملستوى الوجوديى (Ontological level)‏ 624.2 
(غير خطرة). فالبيانات هي مجرد بيانات» وعناصر أساسية يتم استخراجها من العام 
بطرق محايدة وموضوعية تخضع لقيود تقنية. فهي "لا تمتلك أي معان ضمنية كامنة 
فيهاء ولا تقدّم بالضرورة أي تفسيرات أو آراء. ولا تحمل خصائص دلالية قد تكشف عن 
أهميتها وصلاتها " (2010 5121112 10132 0 61:6غ11011 -86162), فهى تخمينية قابلة 
للتحليل. ومن هذا المنظورء فإن (Ae (sensor) jl Za 5lge-‏ سبل المتال ليس لدبه si‏ 
سياسة آو جدول أعمال. فهو ببساطة يقيس الضوء آو الحرارة آو الرطوبة» ...الخ - حيث 
يقوم بإنتاج القراءات التي تعكس حقيقة الواقع عن العالم المحيط ما لم يشوبه خلل فني. 
وبعبارة أخرى. تنتج أجهزة الاستشعار نظرة موضوعية واقعية عن العام وتكشف عن 
الأشياء كما هي في الواقع» حيث إن قياس واقعية الشيء هو مستقل عن عملية القياس له 
(1998 657051865). أما في إطار عمليات القياس التي يلعب فيها العنصر البشري دورا 
مركزياً - في التجارب ال مخبريةء أو إجراء مسح ميداني أو مقابلة شخصية - فإن عمليات 
القياس تطبّق شكلا من أشكل الموضوعية الميكانيكية التي تلتزم بقواعد محددّة. وطرق 
منهجيه دقيقة لإنتاج بيانات منفصله. غير متصلة» ونزيهه على نحو شفافء وخالية من 
تحيز الباحث وهواه وتفضيلاته» ومن ثم فهي مستقلة عن العادات. والتقاليد: والثقافة. 
والمعرفة. والسياق (1995 (Jes (Porter‏ هذا النحوء فإن العلم عند ممارسته بشكل 
صحيح لا ينبغي أن يتلبس بأي دوافع سياسية أو أجندات خفية بحيث يمكن بعد ذلك 
أن تؤخذ البيانات على ظاهرها وعلاتها. وف الواقع» تقترح المصطلحات المستخدمة عادة 
لتفصيل كيفية التعامل مع البيانات عمليات تقنية حميدة مثل: «الجمع»» «الإدخال» 
«الترجمة»» «التخزين» liJ .(Gitelman and Jackson 2013) «uril» g «doJlebl»‏ 
فإن استخدامات البيانات هي التى تخضع للإملاءات السياسية. وبعبارة أخرىء إن الناس 
هم من يفسدون البيانات ويعملون على تجييرها لمصالحهم الخاصة. وليس للعلم بحد 


ذاته. 
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وبالنسبة لآخرينء فإن هذا الرأي لا يمكن تبريره والدفاع عنه؛ إذ تتحذد طبيعة البيانات 
بفعاليه من خلال الكيفية التي يمكننا بها تصور البيانات» وقياسهاء والتعامل معها. فبالنسبة 
لهم» البيانات لم تكن موجودة قبل إنتاجها؛ إلا أنها لا تنشأً من العدم. ويتم إنتاج البيانات 
من خلال القياسء والتجريد والاقتباس.ء وتعميم التقنيات التي تم وضعها ضمن تصور 
لتنفيذ مهمة ما وتسجّل في الأشكال وامقاييس التي تتفق مع المعايير التى اخترعها الناس 
على سبيل امثالء النظام المتري. فالبيانات هي وحدات معرفية. جعلت على نموذج تمثيلى 
لتمكين وإتاحة العمل المعرفي. وقياس وتسجيل البيانات عن نفس الظاهرة من خلال 
العديد من الطرق والأساليب» التي يقدم كل منها مجموعة مختلفة من البيانات التي يمكن 
تحليلها وتفسيرها باستخدام وسائل مختلفة (1998 رء۷ه٥۴).‏ فالكيفيات التي يتم إنشاء 
البيانات بها لا يمكن خحصرها نظرا لتعدد التصاميم والنقاشات والتغديلات التي تطرأ على 
البروتوكولات» والعمليات التنظيمية: ومعايير القياسء: والفئات: وامعايير الخاصة بالبيانات 
في ظل الفوضى المصاحبة لعملية توليد هذه البيانات وإنتاجها. فلو أخذنا حالة قياس 
التعداد السكاني لبلد ما: فإن هنالك العديد من القرارات التي يجب أن تتخذ مثل تلك التي 
تحدد من يضاف للتعداد ومن يستثنى منه على سبيل المثال» أن يشمل الزوارء والأجانب 
المقيمين بصورة مشروعة أو غير مشروعة: وأولئك الذين يتجنبون المشاركة عن عمد أو لا. 
وما إلى ذلك.وأين يجب أن يتم تعدادهم عاى سبيل المثال»:تعدادهم تبعا لإقامتهم ليلة 
إجراء التعداد أو مكان إقامتهم الدائمة في العادة؛ فجميع أنواع القواعد والإجراءات يتم 
وضعها قبل التعداد. ومع ذلك يظل هناك أمور لم يتخذ قرارات بخصوصها واختلاف عبر 
العدادين في طريقة (Porter 1995) gahl‏ 

ونتيجة UI‏ فإن الكيفية المتبعة لتعريف البيانات وتحديدها وجوديا ليست عملية 
فنية محايدة. ولكن معايرة سياسية وأخلاقية يجري التنازع عليهاء ولها نتائج قابلة 
للتحليلء والتفسيرء والعمل قي وقت لاحق )1999 “US ges .(Bowker and Star‏ 
لمرة أخرى. تعمل تبويبات البيانات على استبعاد التباينات والتقلبات وتحديد ما يتاح 
ويحجب داخل مجموعة البيانات» وعلى الرغم من ذلك تكون هذه العملية من التقارب 
والاستقرار معرضه على الدوام للممانعة والرفض وإعادة الصياغة بسبب تعدد الجهات 
الفاعلة» والموضوعات والعمليات موضع المناقشة والردء والتناقض الحاصل في البيانات 
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والذي لا جمكن تطبيقه بسهولة وما يتناسب مع نظام ما (1999 (Bowker and Star‏ 
وعلاوة على ذلك. فإنه بمجرد إنتاج البيانات يكون من الممكن فرزء وتقسيمء وتكعيب 
هذه البيانات بطرق متعددة في عدد من الفئات. وبعبارة أخرىء فإن السانات ليست 
مستقلة عن نظام الفكر والآدوات التى (Bowker and Star 1999) >lo] e35‏ 6343 
النظم الفكرية مُطعّمة بافتراضات فلسفية ومعتقدات تمارس بشكل مختلف. فالواقع: 
وكما لاحظ (38 :2007) 8016111211 أنه قي الوقت الذي يسعى فيه العلم إلى تصوير نفسه 
بالعاط ميه والعموم» تبدو ممارسات العلوم محليه ومتباينة على نطاق واسع» ومن تم فإن 
البيانات لا تمثل ببساطة واقع وحقيقة العام؛ فالبيانات هى وحدات بنيوية حول العام 
.)Dsrosièeres 1998; Poovey 1998)‏ من هذا اممنظور «يتم إنتاج المعرفة العلمية - 
بدلا من براءة اكتشافها» )4 :2013 JLI $ LS (Gitelman and Jackson‏ 
إذا كان إنتاج البيانات عن طريق أداة مثل شبكة استشعارء فإن تفسير 

هذه البيانات يتظلب فهم الأداة - على سبيل المثالء ما الذي تستكشفه أجهزة 

الاستشعار؟ وتحت أي ظروف؟ وكم عدد تكرار مرات ا ملاحظة؟ ومع أي نوع 

من المعايرة؟ )183 :2007 .(Borgman‏ 


ومع ذلك نجد أن العلم يحاول في كثير من الأحيان جعل البيانات حرة ومستقلة 
عن مثل هذا الفهم السياقيء وتنظيم ومشاركة البيانات من خلال قواعد البيانات التى 
يجري التحسين فيها والتخفيف من حدة الفوضى عند إنشائها وحماية المستخدمين من 
معرفة كيفية إنتاج البيانات وتنظيمها (2013 x «Js .(Gitelman and Jackson‏ 
Ries and Jackson )2013: 165(‏ أن الاستخدامات العلمية للسيانات والقائمة على lal‏ 
محايدة وموضوعية هي مجرد تخيلات لا حقيقة لها؛ أنها «تفترض وتصور العام بناء على 
البيانات المتداولة دون النظر إلى مصدرهاء وحالتهاء وجوهرهاء وتاريخها. ومن ذم تبرز 
هذه البيانات على أنها حرة للتنقل عبر العالم كعملة غير متمايزة وعالمية». فى المقابلء 
هما يؤكدان أن «البيانات هي اك ارتباطا من ذلك». 

ونتيجة لذلكء فالبيانات غير مسبقة التحليل» وليست عناصر موضوعية مستقلة. كما 
ges Gitelman and Jackson (2013: 2) zo‏ $ ذلك Luus Bowker (2005) Sg‏ 
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VIRES‏ "البيانات الخام هي مصطلح متناقض؛ «فالبيانات هي على الدوام مطهوة 
سلفاء ولم تكن يوما "خاما" أبداً. فهناك حاجة لتصوّر البيانات كما هي على الحقيقة في 
الوجود والعمل موحسب ذلك (3 :2013 2125011[ 2120 1611121211). فالبيانات - على 
حذ سواء - هي اجتماعية من باب أنها تقع ضمن السياقء ومادية من باب أن لديها 
شكلا (كأرقام ثنائيةء أو رموزء أو أعداد... وما إلى ذلك). ويجري تخزينها على الورق» 
والأشرطة الممغنطة» والأقراص الصلبةء وما إلى ذلك Wilson 2011; Gitelman and)‏ 
3 1501ك12[). كلا المنظورين يعمل على تشكيل القواعد التأسسية للسانات» فعلى 
سبيل «JUL‏ تعتمد البيانات الكبيرة على النقاشات الأخلاقية: والاقتصادية: والسياسية في 
المجالات المختلفة التى تدعم البدء في اعتمادها وتنفيذها (انظر الفصل السابع)ء وتعتمد 
على قواعد البيانات» والحواسيب» والخوادم» وشبكات الاتصال التي تمكن بدورها عمليات 
إنتاج البيانات» ومعالجتهاء ومشاركتهاء وتحليلهاء تخزينها (انظر الفصل الخامس). وتسهل 
هذه الوشائظ فساد التتانات (تعفنها)» وسوء تموضعهاء أو Sl pU ua‏ حَذفهاء أو تآكلها 
من خلال تلف الوحدة التخزينية للأرقام الثنائية - بت (أي تعطل وسائط التخزين نتيجة 
تحلل الأشرطة الممغنطة أو تضرر الأقراص الصلبة) (2013 806115]0:8). وفى الواقع لم 
تكن البيانات قط مطهوّة فقطء ولكنها أيضاً منفتحة لتقبّل أساليب «غير مخطط لهاء وغير 
متوقعة» وعرضية»» و«متحولة بأشكال شبة إنسانية معقدة» وطرق زمانية ناشئة لا تتبع 
على الدوام وصفة حسابية محددة .(Boellstorff 2013) Moos‏ 

ونظرا للطبيعة الاجتماعية والمادية للبيانات: فإننا ننشط ف إعادة صياغة وتشكيل 
«عواطنا اطادية. Asl odlo duilo‏ والتنظيمية. والاجتماعية إلى نوع من البيئات 
التي يمكن للبيانات أن تزدهر فيها... والوصول إلى العلاقة التكافلية مع البيانات» 
(Ribes and Jackson 2013: 152)‏ ومن تم وبينما ينظر إلى السانات بوصفها شتا 
موجودا - شيئا حول الواقع (2013 ط8ا5: التأكيد الأصلي). فإن الفهم الأكثر إنتاجية 
للبيانات هو اعتبارها أحد مكوّنات الواقع وأحد منتجي الواقع في ذات الوقت. إن 
البيانات ليست محض فكرة تمثيلية مجردةء بل هي تأسيسية. وإنتاجهاء وتحليلهاء 
وتفسرها له نتائج وعواقب تتبعها. وكما :Gitelman and Jackson (2013: 2) yo‏ 
«إذا كانت البيانات تخضع لنا بطريقة أو بأخرىء فإننا نحن أيضا نخضع للبيانات». 
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حبث يتم م التقاط البيانات من العامء ولكن ف المقابل تعمل في العالم. إن البيانات م 
hid‏ دوا ولا مكن أن تكون. حميدة (2013 طهط5). بدلا من ذلك» من الضرورى 
فهم «السانات على أنها مؤطرة متاثرة بغيرها ومؤطرة مؤثرة على Gitelman) «lapė‏ 
.(and Jackson 2013: 5‏ وبعسارة أخرىء هناك حاحة إلى ما هو أكثر من مجرد 
الاعتراف العام من قطاعي العلوم والأعمال لأهمية التصور المفاهيمي للبيانات. 


JI‏ النقدي حول قواعد السانات والىنى التحتىة للسانات: 

في العادةء يتم تجميع البيانات في مجاميع (102]256]5) في محاولة لفهم البيانات» والتي 
غالباً ما يتم تنظيمها وتخزينها في قواعد بيانات (وهي وسيلة لتنظيم وتخزين البيانات 
اللي مكن الايكاكلام عنها بطرق متعدةة) وبنى تحتية للبيانات Clan eda ota‏ 
الأرشيفية (17©5داء41) وحاويات البيانات (05101165م182) (انظر الفصول الثاني والثالث 
والخامس). وكما كان الحال مع التصور المفاهيمي للبيانات بشكل عام؛ فمن المهم UIS‏ 
التفكير بشكل نقدي حول طبيعة قواعد البيانات والبنى التحتية للبيانات» وإنتاجها من 
الناحيتين الاجتماعية والتقنية (50010-161112131): وكيف أنها تعكس العقلانية حول 
العام في الوقت نفسه لأنها تتكاثر وتعزز هذه العقلانية. وكان هذا التفكير النقدى غاشا 
إلى حد كبير فيما يتعلق بالبيانات الكيرةء والبيانات المفتوحة» والبيانات الصغيرة الموسعة: 

مع التركيز حتى الآن عليه ليكون ذا طبيعة تقنية وآلية بشكل أكبر. 

وتمتد الفرضية المطروحة التى تم” تبنيها وتطويرها في جميع أنحاء هذا الكتاب من الحجة 
ا مبنية في القسم الأخيرء وهي الافتراض بأن قواعد البيانات والبنى التحتية للبيانات ليست 
سساطة al dlas‏ وسائل تقنية لتجميع وتدادل السانات؛ ولست بالتأكيد منتجات لتخزين 
البيانات الملتقطة عن العام ولكنها حزم من العمليات الطارئة والمترابطة التي تقوم بتأدية 
الأعمال في العام )2011 .)Star and Ruhleder 1996; Kitchin and Dodge‏ إنھا آنظمة 
اجتماعبة تقنة معقدة كامنة كجزء لا بتجزاأ > ضمن المشها المؤسساق الأكر من الباحثنء 
واممؤسسات» والشركات» التي تشكل أدوات à Ll‏ في إنتاج «1l‏ ,43 والحكم „JUI "PT‏ 

ويتم تصميم وبناء قواعد البيانات على تقبّل أنواع معينة من البيانات وتمكين أنواع 
معينة من التحليلء ولذا فهنالك اثار عميقة متر تبه على الكيفية التي يتم بها هيكلتها على 
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الاستفسارات والتحليلات الممكن أداؤها؛ كما أن شروط صياغتها من شأنها آن تحدد العمل 
الذي ممكن القيام به عليها ومن خلالها (2012 616مم181). فعلى سبيل امثال. يختلف 
تخزين البيانات في قواعد البيانات اختلافا تاما عن الشكل السردي من حيث ما تم تخزينه: 
وكيف يتم تخزينه» وكيف من امممكن استدعاؤها وإعادة استخدامھا )2005 .)Bowker‏ 
وينتج عن قواعد البيانات إهمال وتجاهل لبعض البيانات» إضافة إلى الثغرات الكامنة ف 
البيانات» وذلك كلما تم الكشف عن علاقات بين البيانات وتوفر الإجابة عن بعض الأسئلة 
التي يتعين الإجابة عنها؛ فهي تقَيّد وتتيح من خلال وجودها (الأنطولوجيا)» وتنتج العديد من 
العلاقات ق ذات الوقت الذي يتم فه إخفاء علاقات أخرى )2013 (Ruppert 2012; Vis‏ 
واستنادا .Derrida |l‏ فقد جادل (12 :2005) 801161 بأن قواعد السانات وال محفوظات 
الأرشيفية هي المتحكم (1155176(): فهي "تقول لنا ما نستطيع وما لا نستطيع أن نقوله" من 
خلال تحديد ما يمكن تذكره وما يجري تجاهله ونسيانه. فهذا التذكر والتناسي يتم تحديده 
في الأصل Ga‏ خلال أنظمة وممارسات مبنية على قوانين سياسية وفلسفية: 

ومن هنا فإن التبويبات داخل قواعد البيانات غير ثابتة وغير طبيعية. ولكن يتم إنشاؤها 
من قبل جهات فاعلة ذات أهداف محددة تعمل ضمن مجتمعات الممارسة. أساليب 
الحوكمة» والقيود التقنية الفنية. ومن ثم» فإن قواعد البيانات هي تعابير عن السلطة / 
المعرفه وهي تقوم بإقرار تشريعها وإعادة إنتاج هذه العلاقات (2012 (Ruppert‏ على 
سبيل «JULI‏ تحديد معدل التأمين لشخص ما أو ما إذا كان بإمكانه السفر بين البلدان. 
وعلاوة على ذلك: فإن قواعد البيانات هي كيانات ديناميكية متغيرة تقوم بإجراء «عملية 
مستمرة من التمييز والتفريق» (129 :2012 616م14112) من خلال التفاعل مع مجاميعها 
المرتبطة بها (المنشئون» ا مستخدمون» البرمجيات» الأجهزةء الشبكات» وما إلى ذلك). 

وق الوقت نفسه»ء عملت قواعد البيانات على فصل عملية تحليل البيانات عن البيانات 
نفسها من خلال تمكين إجراء استعلامات وحسابات معقدة دون الحاحة إلى إجراء هذه 
التحليلات التي تتطلب الاطلاع والعمل مع البيانات نفسها أو حتى فهم الكيفية التى 
تم من خلالها تجميع البيانات وتنظيمها )2013 .(Gitelman and Jackson‏ وقد تم 
تعزيز هذا الفصل من خلال اليات مثل التوحيد العياري znal (Standardization)‏ 
والبيانات الوصفية والتعامل مع البيانات دون النظر إلى السياق الواردة فيه وبعيدا عن 
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التأثير السياسي (2011 :1171150). والأهم من ذلكء فإن هذا الفصل والتحرير للبيانات 
قد مكن السلطة / المعرفة المتعلقة بقواعد البيانات من الانتقال والانتشار وليتم توظيفها 
من قبل الآخرين بعيدا عن الأعمال الداخلية المعقدة فيها وتاريخها وسياسة الإنتاج لها 
(بالطريقه نفسها التي يستفيد فيها السائق من السيارة من دون معرفته JS guo LAS‏ 
أنظمتها المعقدة أو ماذا تعمل أو كيفية تفاعلها لتشكيل تجربة القيادة). ومن ثم يمكن 
للباحثين الاستفادة من قواعد البيانات الحكومية مثل التعداد السكانى أو المسح التجاري أو 
المؤشرات الاقتصادية دون معرفة الدوافع السياسية لم وكيف تم بناء قواعد البيانات» أو 
الجوانب الفنية لإنتاجهاء أو وجود الألفة الشخصية مع الظواهر الملتقطة. على سبيل المثال: 
استخدام الوزارة الإيرلندية للبيئة لقواعد بيانات عقارية غير مكتملة في آيرلندا في مرحلة 
ما بعد الانهياز الاقتصادي 2008 (متوفرة على الرابط: 


(http://www.housing.ie/OurServices/Unfinished-Housing-Developments.aspx 


حيث كان للمرء أن يجري البحثء» والتصورء والاستخلاص للنتائج حول العقارات في 
إيرلندا دون أي معرفة مسبقة عن تاريخ وسياسات المسح. وكيف ES‏ القيام به» ودون زيارة 
أي من تلك العقارات (انظر ا ,20128 ..21 )© «ذداء1؟1). فمثل هذا التحرير والفصل مكن 
من العمل مع قواعد البيانات على أنها غير متغيرة ومستقرة وقابلة للتحول والنقل عبر 
امكان والزمان )1989 .(Latour‏ 

وتستضيف البنى التحتية للبيانات قواعد البيانات وتصل بينها لتشكل بنية تقنية 
اجتماعية أكثر تعقيدا. وكما هو الحال مع قواعد البیانات» لا يوجد شىء کامن آو معطی 
حول كيفية تكوين هذه الهياكل الأرشيفية والتشاركية. وف الواقع» وكما نوقش في جميع 
أنحاء الكتاب» تعرّض تصميم وإدارة البنى التحتية للبيانات إلى تحديات تقنية وسياسية تم 
التصدى لها من خلال نقاشات فوضوية ومفاوضات عبثية تمت ف سياق أتصف بالعديد 
من الأجندات (جداول الأعمال) والقولبة الحكومية: فالحلول التي تمّ إيجادها والمتعلقة 
بالمعاييرء والبروتوكولات. والسياسات» والقوانين كانت بطبيعتها ذات اثار تقريبية كونها 
هدفت إلى تثبيت أرضية مشتركة وتعميم ال ممارسات ونشرها بين ا لمطورين والمستخدمين 
(2012 1.3111131116): والتمويه على وتخفيف حدة التوتر والتباين بين قابلية الاستخدام 
وإتاحته والحد من التخصيص وتقييد الابتكار» ومنع الطرق البديلة لهيكلة وترتيب البيانات 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة: والبنى التحتية للبيانات» والنتائج المترتبة عنها oo‏ 


AA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل الأول 


.)Star and Ruhleder 1996)‏ وبالنظر إلى حدة التوترات» ينبغي التأكيد على عمليات 
التقريب باستمرار وبشكل متكرر من خلال التطبيقء والإدارةء وأنظمة الحوكمة Star and)‏ 
UA .(Lampland, 2009‏ أكد 112 :1996( 5s25 Y» &b (Star and Ruhleder‏ ,3$ 
مطلق يصدر منه التحكم وامعايير؛ وكذلكء. لا أطراف مطلقة ... مع كون البنية التحتية 
شيء ظاهر للناس في الممارسة العملية» ومتصلا بالأنشطة والهياكل». 


فهذا الظهورء وعلى الرغم من عدم تركزه بشكل كاملء ليس شكلا حرا وهو يتشكل 
من خلال علاقات بنيويهة واسعة. فقد حادل(2001) Jl ob Graham and Marvin‏ 
التحتية هي تأسيسية نتيجة «تراكمات بعيدة المدى من التمويلء والتكنولوجياء والدراية 
والسلطة التنظيمية والجيوسياسية» (ص. 12) والمحافظة على «الهندسة الفنية الاجتماعية 
للسلطة» (ص. 11) من المصالح الاجتماعية المتحجرة. وتشمل هذه التراكمات أنظمة من 
التشريعات تسعى من الناحية القانونية ومن خلال أشكال الحوكمة لتحديد كيفية إدارة 
وتحليل ومشاركة البيانات» على سبيل اطثال قوانين حماية البيانات (انظر الفصل العاشر). 
ولذلك. اقترح (8 :1987) 56833 أن البنية التحتية للبيانات لديها: 

نوعان من الهياكل التنظيمية - الاجتماعية وا معرفية: فالتنظيم الاجتماعي يتكون من 
العلاقات الاجتماعية والاقتصادتة لأفراد العينة الممثلة: وأجهزة الدولةء والشركات الخاصة: 
والمنظمات اطهنية والدولية» وغيرهم من المشاركين فى إنتاج تدفقات البيانات من مصادرها 
الأصلية وحتى نقاط التحليلء والتوزيع والاستخدام» في حين يشير التنظيم المعرفي لهيكلة 
البيانات نفسهاء بما في ذلك حدود الاستعلام: والافتراض عن الواقع الاجتماعي» وأنظمة 
التصنيف. وطرق القياسء والقواعد الرسمية لتفسير وعرض البيانات. 

كما أكد )2007( .Dourish and Bell‏ 43 لا مكن النظر بصورة صرفة لقواعد البيانات 
والبنى التحتية كوسائل وأدوات ثانوية لأنها تشمل بطبيعتها نواحي AS‏ واقتصادية: 
ومعرفية,» وهي غارقة في الأهمية على المستوى الاجتماعي. ولذلك اقترحا منظورين يمكن 
من خلالها فهم البنى التحتية للبيانات: المنظور الأول يتضمن قراءة اجتماعية سياسية 
يدرس من خلالها «بلورة العلاقات المؤسسية» (ص. 416). أما ال منظور الثانى فهو القراءة 
التجريبية التى تدرس " كيفية تشكيل البنى التحتية للبيانات لإجراءات الأفراد وخبراتهم" 
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(ص. .)6١١‏ وفي كلتا الحاتينء تفهم البنى التحتية للبيانات ككيانات مترابطة. ويعيد هذا 
الترابط تشكيل العام بشكل عرضي بناء عليهاء وهي بدورها تتشكل من قبل العام كذلك. 
ولك نصل إلى استخدام قواعد البيانات والبنى التحتية للبيانات والاعتماد عليها لفهم 
العام والقيام بأعمال فيه. فإن ممارساتنا المنطقية والمادية تتكيّف وتتمحور كاستجابة لهما 
Yg .(Star and Ruhleder 1996)‏ ینعکس العام في البيانات فقطء بل يتغير بها؛ «فالعمل 
على إنتاج وحفظ وتبادل البيانات ومشاركتها يقوم بإعادة تشكيل العواط التنظيمية, 
والتكنولوجيه» والثقافيه من حولم« )147 :2013 (Ribes and Jackson‏ 

وبعبارة آخرىء لا تدعم قواعد البيانات والبنى التحتية للبيانات البحوث ببساطة 
ولكنها تغير وبشكل جذري الممارسات والنظم البحثية - الأسئلة المطروحة: وكيفية طرحهاء 
وطريقة الإجابَة عليهاء وكيفية تطبيق الإجابات. ومن يجري البحث وكيف يعملون بصفة 
باحثين (انظر الفصل الثامن). فعلى سبيل اطثالء وفي دراستها لتطور التعداد السكاني 
الكندى وأطلس كنداء ببّنت (2012) 1:3111131016 بالتفصيل كنف تطور كل تعداد بشكل 
متواتر ومتكرر على أساس تماذج للعالم شكلت طرقاً لتصور وعرض كندا. وقد جادلت بأن 
محفوظات البيانات والبيانات نفسها تشكل «نظام ذاكرة خارج الجسم المؤسسي يسمح 
بسرد قصص عن طبيعة كندا... من خلال الخرائط والرسوه البيانية والنماذج والإحصاءات 
التي تعتمد على أجهزة الاستشعارء والبيانات: وقابلية التشغيل البينيء ومعايير رسم 
الخرائط على شبكة الإنترنتء والبوابات الإلكترونية» والبيانات الوصفية والنماذج. والعلوم 
والهياكل المفتوحة» (ص. .)١!‏ في الممقابلء تعدل هذه القصص النماذج الأساسية ومن ثم 
البنية التحتية للبيانات» مما يعمل على تحوير الوسائل التي يتم من خلالها إنشاء القصص. 

ويتطلب تفهّم قواعد البيانات والبنى التحتية للبيانات التفكيك والتفريغ بعناية لطبيعة 
نشوتهاء وتداخلهاء وعلائقيتهاء وسياقيتها (1996 1101116061 .(Star and‏ وهذا يعني ÀJ!‏ 
Infrastructural) uY! wl uL Bowker and Star (1999: 34) 4 à$ GU. 5‏ 
(Inversion‏ أي أن ندرك أعماق الترابط بين الشبكات التقنية وال معاير الفنية. من جهة: 
والعمل الحقيقي للسياسة وإنتاج المعرفة من جهة أخرى. وکما ııنٽ‏ )2012( .Lauriault‏ 
فإن هذا يتطلب أيضا تحليلا تاريخيا يوق كيف تتطور قواعد البيانات والبنى التحتية 
للبيانات مع مرور الوقت وتغير المكان. 
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: (Data Assemblages and the Data Revolution) مجاميع البيانات وتورة البيانات‎ 

كان الجدل والحجة الرئيسية ال معروضة في هذا الفصل بأن التفكير بالبيانات لا يكون 
بالطريقة المباشرة: ولا مكن أن توجد البيانات بشكل مستقل عن الأفكارء والآليات. 
والتقنيات» والنظم» والناس» والسياقات» بغض النظر عن كونها في كثير من الأحيان يتم 
تصورها بهذه Ribes and Jackson 2013) 4à „hll‏ ;2012 غ1.211131116). فالبيانات يتم 
إنشاؤها بوصفها نتاجا لكثير من العقول العاملة في مختلف الحالات والأوضاع» وهى مؤطرة 
وتتشكل في ظروف وهياكل مختلفه. 

ولذا فإن من طرق فهه البيانات هو التفكير بها كقضية مركزية لتجمّع فنى 
اجتماعي معقد. ويتكون هذا التجمع للسيانات من العديد من الآدوات pem‏ 
التي تزداد تشابکاء وتطوراء وتتحوّر مع مرور الزمن وتبدل ال مكان (انظر الجدول1-3). 
وتصوغ كل أداة di gouan‏ بعناصرها ما هو ممكنء وما هو مظلوب» وما هو متوقع 
من البيانات. وعلاوة على ذلك. فهي تتفاعل بعضها مع بعض ويشكل بعضها بعضا 
من خلال شبكة معقدة ومتغيرة من العلاقات المتعددة الأوجه (انظر الشكل 1-3). 
وكما اذعى كل من (2013) 2هؤع]آء3[ «Ribes and‏ فإن هذه الأآدوات لا تقوم بتأطير 
ماهية,وكيفية إنتاج البيانات:وإلى أي حِدّ من«اللمكن توظيفها فجسب: ولكنها بحدّ 
ذاتها منظمة ومدارة لتقوم بإنتاج مثل هذه البيانات. وعلى ذلك. فإن البيانات 
ومجاميعها تتشارك التحديد (20-061611111110115)) وتشادل عملية التشكيل كل منها 
(ys lago 1355s (Mutually Constituted) ,2 MJ‏ خلال مجموعة من الممارسات 
والعلاقات المتظقية والمادية 'الطارئة: والغلائقية: والسياقنة. وعلى ذلك..يغتلف كل 
تجميع للبيانات في نسق ترتيب العناصر وسياقهاء ولكنها تتشارك في قواسم مشتركة 
وتأثير كل منها في الآخر بسبب اعتماد الأدوات على بعضها وتداخلها والاتفاقيات التى 
تغطي مجاميع البيانات. ومع نشوء أفكار ومعارف جديدة: واختراع التقنيات» وتطوير 
المهارات» وانفتاح الأسواقء فإن مجاميع البيانات تتطورء وتتحوّرء وتندمج» وتتفكك. 
ونتيجة لذلكء هناك تنوع كبير من تجمعات البيانات عبر النطاقات والاختصاصات 
امختلفة. 
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جدول رقم (V-Y)‏ 
الآأدوات والعناصر مجاميع السانات 


الجهاز / النظام العناصر 

Sl,‏ التفكبير. الفلسفيات. Jl «L5» AUI‏ 38 الإيديولوجيات» 
امنطقيات.... إلخ. 

النصوص البحثية: الأدلة: المجلات: المواقع الإلكترونية: الخبرة» الخطب, 
منتديات الدردشة.... إلخ. 


نظم الفكر 


أشكال ال معرفة 


التمويل نماذج الأعمال: الاستثمارء رأس امال الاستثماريء اط منح» التبرعات والصدقات. 
Qu JJ‏ إلخ. 

السياسة» الأنظمة الضريبية» الرأي العام والرأي السياسيء الاعتبارات 
الأخلاقية»... إلخ. 

معايير البيانات: صيغ ال ملفات. متطلبات النظم: اللوائح البروتوكولية: 
القوانين» الترخيصء أنظمة ال ملكية الفكرية.... إلخ. 
الآوراق / AYI‏ الحاسبات الآلية؛ الخدمات «Aue JI‏ أجهزة الاستشعارء 
lo iul‏ الضوئية»ء قواعد البيانات. شبكات الاتصالء الخوادمء... إلخ 








الجوانب الإدارية 







والقانونية 
الأصول امادية والبنى 
التحتية 
اممارسات 
UAE‏ وال مؤسسات 











التقنيات» طرق التنفيذء السلوكيات المستفادة. الاتفاقيات العلمية.... إلخ. 

سجلات الأرشفة: الشركات» اممستشارون» ال مصنعون. بائعو التجزئةء الجهات 

الحكومية: الجامعات. المؤتمراتء النوادي والمجتمعات, واللجان والمجالس» 

المجتمعات اممارسة.... إلخ. ش 

القخصيات وايلجتمعات: | منتهو التناننات: القثمون عن 'السائنات: المدنرون: اللحللنون: العلماء. 
السياسيونء ا مستخدمونء ال مواطئون.... إلخ. 

الأماكن المختبرات: المكاتبء. مواقع العملء مراكز البيانات» مجموعات الخوادم 





مجمعات الأعمال.... والقوى البشريه المتصلة بها. 
الأسواق للسانات: ولمشتقاتها (على سبل المثالء النصوص. الجداولء المخططات» 
الخرائط)ء واممحللون» وبرمجيات التحليل» والتفسيرات.... rel‏ 
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فهذا الكتاب يبحث ف تجمعات البيانات الناشئةء وام متطورة, ال منتجة للبيانات المفتوحة. 
والبنى التحتية للبيانات» والبيانات الكبيرةء وللقيام بذلك يطرح الكتاب ثلاث مسائل رئيسية 
للمناقشة: أولاء هناك حاجة لتطوير طرق مبدئية وفلسفية لفهم البيانات. فهناك نقص 
ملحوظ في التفكير النقدي والبحثي عن البيانات وني السانات بحد ذاتها من حيث التكوين 
والتشغيل للمجاميع المحيطة بهاء وعلى الخصوص بالمقارنة مع التركيز والاهتمام اللذين 
تحظى به مفاهيم المعلومات والمعرفة. وذلك على الرغم من أن البيانات هي عنصر أساسي 
في إنتاج المعرفة. Lob‏ هناك å DIE‏ بيانات جارية تعمل على تشكيل لحظة حاسمة في تطور 
وتحوّر تجمعات البيانات. ونظرا لالتقاء العديد من التطورات الناشئة ف مجال الحوسبة 
والتقنيات الممنهجيةء وام مجالين السياسي والاقتصاديء فإن حجم البيانات» وتنوعهاء وسرعتهاء 
ودقتهاء وتوافرهاء والكيفيه التي يتم بها معالجه البيانات وتحليلهنا وتخزينها وتوظيفها 
لزيادة التّصر وتحصيل القيمة. قد شهد تحؤلا i‏ ثالث کا ملختلف التحديات 
التقنية والأخلاقية والعلمية التي أثارتها ثورة البيانات» فإن هناك حاجة ملحّة لتطوير فهم 
مفصل لتجمعات البيانات الجديدة والناشئة التي يتم إنشاؤهاء ولذا تهدف الفصول العشرة 
التالية إلى توفير نظرة إجمالية على نطاق واسع؛ dolig‏ ودقيق لهذه التجمعات وتسليط 
الضوء على القضايا التي تتطلب مزيدا من الاهتمام والبحث. 
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التقاطع بين آدوات مجاميع البيانات 
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الفصل الثانى 
السيانات الصغيرة (102162 5111211): والينى التحتية للسانات 
«(Data Infrastructures)‏ ووسطاء السانات (15ع81:012 10242) 


قىل ٠‏ بضع سنوات مضت كان مصطلح «البيانات الصغيرة» نادر الاستخدام., إن لمم يكن 
(eem‏ وقد ذاع انتشاره ف بحكم الواقع على النقيض مما سمي «البيانات الكبيرة». 
فكل البيانات كانت ف الواقع بيانات صغيرة ومن ثم لم تتطلب تمييزها بهذا الإصطلاح. 
وسيجري لاحقا مناقشة ما قام على تأسيس البيانات الكبيرة بالتفصيل في الفصل الرابع: 
ولكن من الضروري تسليط الضوء على الفرق بين البيانات الصغيرة والبيانات الكبيرة. وذلك 
قبل التوحه إلى مناقشه كبفية تحول البيانات الصغيرة من خلال النى التحتية الجديدة 
للسانات والأسواق المقدرة ببلايين الدولارات. كما سيتم là y‏ في الفصل التالي مناقشة 
انفتاحها لتقبل المشاركة وإعادة الاستخدام. 

فمن الناحية التقليدية» ونظرا للتكاليف والصعوبات ال مصاحبه لعمليات إنتاج ومعالجةه 
وتحليل وتخزين البيانات» فقد تم إنتاج البيانات الصغيرة بطرق مضبوطة بأحكام باستخدام 
jsl olai‏ العينات التى تحذ من نطاقهاء وصلاحيتها الزمنية؛ Miller 2010) ls‏ .[.11). 
وبينما ممكن أن تكون بعض قواعد البيانات كبرة le‏ فى الحجم» مثل قاعدة بيانات التعداد 
الوطني: ولجعل ممارسة تجميع هذه البيانات قابلة للإدارة. فإن عملية إنتاجها عادة ما تتم 
خلال بضع سنوات وتكون محدودة ة النطاق (في حالة التعداد. يجرى في العادة مرة واحدة كل 
عشر سنوات ويكون مقتصرا على ثلاثين إلى أربعين سؤالا فقط). وعلاوة على ذلك» فقد كانت 
دقه البيانات الصغرة العامة (Small Tertiary Data)‏ $ كثير من الأحيان ضعيفة la>‏ (كانت» 
(Je «JUL ao e‏ مستوى المقاطعات أو الدول وليس الأفراد والأسر)ء JL UNI ol GS‏ 
المستخدمة لإنتاجها غير مرنة على الإطلاق (على سبيل «JUL‏ من ا مستحيل تعديل الأسئلة أو 
الإضافة لها أو الإزالة منها مجرد التهيئة للتعداد وإعداده والبدء بإدارته لأن ذلك سينعكس 
Ua‏ وبشكل جدى على القدرة على المعالجة والتحليل). وف المقابلء» تتميز البيانات الكبيرة 
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جدول رقم (١-؟)‏ 
مقارنة السيانات الصغيرة والبيانات الكبيرة 


الدقة والتحديد من تقريبية وضعيفة إلى 
المنطقية / العلائقية : 


Ac‏ الدراسة 


i 


e 
f: 
to 


$ 





وفى الوقت الذي تعد فيه البيانات الصغيرة واحات صغيرة ضمن صحارى البيانات. 
تنتج البيانات الكبيرة طوفان بيانات حقيقي. وقد أذْى ذلك بالبعض إلى التساؤل عما إذا 
كانت البيانات الكبيرة قد تؤدي إلى زوال البيانات الصغيرة أو تضاؤل مكانة الدراسات التى 
تعتمد على البيانات الصغيرة نظرا ممحدوديتها ف الحجم» والنطاق» والصلاحية الزمانية. 
فقد لاحظ )2008( de AEAII Sgal gë SYS ol Sawyer‏ سبل المثال» توجه 
موارد التمويل المحدودة الخاصة بها الى محالات السانات الغنية على نحو متزايد. وذلك 
رها بسبب التداخل بين حجم البيانات وسرعتها مع مقدار التبصر والتوظيف والقيمة: 
وآن هذه الوكالات تحول الأسئلة البحثية التى من الصحعب أن تنتج بيانات كبيرة لجهات 
التمويل الأخرى المتعددة وتمنحها وضع هامشي داخل وخارج هذه المؤسسات الأكاديمية. 


4595 
سر يعة؛ 
و 
عالرة 


dsw 
AJ 


التمويل نحو البحوث التجريبية التطبيقية ذات الشراكة الصناعية. وقد أدى إعادة الترتبب 


n 
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السانات الصغيرة؛ والبنى التحتية للسانات» ووسطاء السانات 


لأولويات البحث إلى سوء الفهم لطبيعة البيانات الكبيرة وقيمة البيانات الصغيرة: فالبيانات 

الكبيرة رما تهدف إلى أن تكون شاملة» ولكن كما هو الحال مع جميع البيانات فإن كليهما 

عبارة عن تمثيل (1©562620101م112) وعينة (16م5312): فماهية البيانات التي يتم التقاطها 

à e Rd‏ الواقع من خلال التالي: 

ه مجال إطار عرض/ أخذ العينات (حيث يتم توظيف أجهزة التقاط البيانات وماهية 
إعدادات التهيئة لها/ ومعاملاتها؛ مثل من يستخدم المكان أو وسائل الإعلام» وعلى سبيل 
المثال من الذي ينتمي إلى وسيلة التواصل الاجتماعي الفيسبوك أو يتسؤّق في محلات 
وول مارتء..إلخ). 

« التقنية واطنصة المستخدمة (المسوحات ال مختلفة. وأجهزة الاستشعارء والعدسات. 
وامطالبات dual‏ وا ملخططات والتصاميم... «eJ‏ وكلها لنتج فروقا وتباينات à‏ ماهصة 
البيانات التي يتم إنشاؤها). 

NUN TN السياق الذي يتم إنشاء السانات فيه (الأحداث الجارية تعنى أن البيانات تقع‎ o 
إلى الظرف الذي تقع فيه).‎ 

o‏ تبوسات (أنطولوجية) السانات ال مستخدمة (كيفية معايرة السانات وتصنيفها). 

٠‏ البيئة التنظيمية فيما يتعلق بالخصوصية» وحماية وأمن البيانات. 


وتلتقط البيانات الكبيرة في العموم ما هو سهل التقاطه - آي البيانات التي يتم التعبير 
عنها علنا (ما کتب» i‏ ومُررء ومُسح ضوئیا وما تم استشعاره... إلخ؛ وتصرفات الناس وسلوكهم؛ 
وحركة الأشياء) - وكذلك البيانات المستنفذة ilg‏ هى ناتج وظيفة رئيسية وليست ال مخرج 
gud l‏ والبيانات الوصفية التى تمّ إنشاؤها تلقائيا. وتأخذ البيانات الكبيرة هذه البيانات 
بالقيمة الاسمية: على الرغم من أنها قد لا تكون قد تم تصميمها للرد” على أسئلة محددة 
والبيانات الناتجة قد تكون عشواتية وغير دقيقة (انظر الفصل التاسع). 

أما البيانات الصغيرة فقد تكون محدودة في الحجم de ulg‏ ولكن لديها تاريخا طويلا 
من التطويرء مع منهجيات مقررة وأطوار للتحليلء وسجل حافل من الإجابات الناتجة للأسئلة 
العلمية. ومكن لدراسات البيانات الصغيرة أن تكون مصممة بشكل أفضل بكثير للرد على 
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أسئلة بحشة محددة والاستكشاف المفصّل وال معمّق للطرق المتنوعة: والسياقية: والمنطقية 
وغير المنطقية التي يتعامل بها الناس: ويتم فهم العالم بهاء وكيفية عمل العمليات العلمية 
(انظر الفصلين الثامن والتاسع). ويمكن أن تركز البيانات الصغيرة على حالات محددة وتخبر 
عن قصص فردية» وسياقية: ودقيقة. وبسبب أنها تستهدف ظاهرة معينة» فهي تركز بشكل 
مكثف على قضية وعادة ما تكون أقل حاجة للموارد بشكل مكثف: وتسعى دراسات 
البيانات الصغيرة على التنقيب عن الذهب من خلال العمل في شق ضيق للغايةء ف حين 
تسعى دراسات البيانات الكبيرة إلى استخراج شذرات من خلال التعدين في حفرة مفتوحة 
وشفط وغربلهة مساحات Ax LS‏ من الأراضي. ومن ثم فقد ,3( )2008( Ae Sawyer‏ آن 
التمويل يحتاج إلى استهداف الإجابة عن الأسئلة الحرجة. سواء كانت معالجتها باستخدام 
بيانات صغيرة أو كبيرة» وليس مجرد أن توجّه نحو المشاريع التي يمكنها الوضول إلى كميات 
هائلة من البيانات على أمل أنها تحوي بطبيعتها رؤى وأفكارا مفيدة. 

وهكذاء يمكن القول إنه من ال ممكن تحصيل المزيد من القيمة والرؤى من البيانات 
الصغيرة من خلال توسيغ نطاقها إلى مجموعات بيانات أكبر. وجعلها متاحة لإعادة 
الاستخدام من خلال البنى التحتية للبيانات الرقمية والتي تجعلها إضافة إلى ذلك قابلة 
مختلف أشكال التحليل الحسابيء والحفاظ عليها للأجيال القادمة. ونتيجة لذلك؛ وكما هو 
الحال مع البيانات الكبيرة» فقد استثمرت موارد كبيرة في السنوات الآخيرة لإنشاء مثل هذه 
البنى التحتية للبيانات» والتي أحدثت تغييرات كبيرة في مشهد البيانات. 


(Data Archives) SULJI Slb gåso (Data Holdings) UI cb si 
:(Data Infrastructures) WULU dusil والىنى‎ 
فم جمع'البيانات معا وتخزينها لقازة طويلة من الناريخ الملسشل وقد كانت هذة‎ 
غير رسمية ورسمية على د سواه فى طبيعتها: فالممارسات غير الرسعية.تتكون‎ Leld 
ببساطة من جمع البيانات وتخزينهاء في حين تتكون ال ممارسات الرسمية من مجموعة‎ 
JSUJls (Data Curation) اممارسات الفاعلة ذات العلاقه بإدارة دورة حياة السانات‎ 
المؤسسية المصممّة لضمان الحفاظ على السانات من أجل الأجيال القادمة. وقد يكون من‎ 
الأفضل وصف الممارسات غير الرسمية بأنها حاويات البياناتء في حين أن الممارسات الرسمية‎ 
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ھی محفوظات (أرشفات) البيانات. ويجريء فقي كثير من الأحمان: الخلط سنهما آو تستخدم 
بالتبادلء جنبا إلى جنب مع غيرها من المصطلحات مثل النسخ الاحتياطى (Backup)‏ 
وبنك المعلومات «(Information Bank)‏ ومستودع البياناٽ ata Repository)‏ ()» ولکن 
المحفوظات الأرشيفية تمتلك خصائص مميزة جدا عند أمناء المحفوظات (ءاءذ۷¡٤۸۲)‏ 
ell‏ 

فا محفوظات هي مجموعات رسمية منظمة من البيانات التي يتم هيكلتها وتوتيقها 
ونشرها بشكل فعال» مصحوبة بالبيانات الوصفية المناسبة لهاء مع التخطيط الفعال لقضايا 
امحافظة علبيها وإتاحة الوصول الها وإمكانات اكتشافها (2013 .(Lauriault et al.‏ 
فالمحفوظات تهدف بشكل واضح وصريح وطويل الأمد. للحفاظ على البيانات لإعادة 
استخدامها في ال مستقبل. إن مفهوم الحفاظء فى هذا السياق» لديه استخدام خاص محدد على 
«cobalad] slo» dx Allg àjlall dla 25S (ye ds gau dl‏ القوا8ةالكتراتيجيات 
الرامية إلى إطالة Jol‏ الكائن (البيانات) من خلال المحافظة عليه في حالة مناسبة للاستخدام: 
uel als s e els‏ أم في شكل مُستدام أكثر ثباتاء مع الإنقاء على الشكل الفكري 
للكائن» (2013 ,2 126:2412158:5). ويسعى الأرشيف للحفاظ على مجموعة سجلات كاملة: 
وليس مجرد البيانات؛ أي أنها تشمل كلل الوثائق الداعمة والبيانات الوصفية وغيرها من 
مواد ذات الصلة التي تحتوي على تفاصيل المنشأ والسياق فيما يتعلق بكيفية إنتاج البيانات 
والطريقة التي ينبغي أن تعامل وتحلل وتفسّر بها. فالنهج المتبع في الحفاظ على البيانات 
مبني على الإدراك التام بأن التقنيات والبروتوكولات واطبادئ التوجيهية لأفضل الممارسات 
هي عرضة للتغيير والتقادم: بمعنى أن البيانات سوف تحتاج للتنقل والترحيل عبر منصات 
وتقنيات بسبب الابتكارات الجديدة التي تأي في السياقء كما يدرك النهج المتبع بأنه دون 
ممارسات فعالة لإتاحة وإعادة الاستخدام والمشاركة للبيانات فإن البيانات معرضة للتلف, 
أو الضياعء. أو الحرمان من بياناتها الوصفية السياقية والوثائق الداعمة );2007 Borgman‏ 
2 1035155). ويسعى المحفوظ الأرشيفي إلى توفير موارد جديرة بالثقة. من خلال الحفاظ 
على سلامة البيانات (121681167 10242) مع مرور الوقت. 

وف بعض الحالات» قد eb‏ مؤتمنو البيانات 4J98 e (Data Custodians)‏ قانونىە 
لحفظ وأرشفة البيانات بشكل مناسب لإعادة الاستخدام الحالي والمستقبلي. كما قد يكون 
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المؤتمن على الأرشفة والقائم عليها نفسه سلطة قانونية تشريعية. فعلى JELI Luwu‏ 
فإن المحفوظات الأرشيفية الوطنية والوكالات الإحصائية الوطنية هي الكيانات القانونية 
التى عهد إليها جمع وإنتاج وأرشفة قواعد بيانات محددة مثل السجلات الشخصية 
للأفراد والحسابات القومية: والتعدادات والمسوح السكانية. وينبغي أن تمتثل ا محفوظات 
Lá‏ للتشريعات المتعلقة بحقوق الوصول إلى السانات: والخصوصية. وا مبادئ الأخلاقية: 
وحقوق الطبع والنشرء واملكية الفكرية. وتحديد المسموح لهم للوصول إلى البيانات وما 
يمكنهم القيام به من خلال تحديد الصلاحيات على البيانات. على سبيل المثالء في العديد 
من البلدان» من ال ممكن نشر سجلات التعداد في شكل إجمالي. مع تقييد نشر السجلات 
الشخصية إلى ما بعد مئة عامء فالالتزام بإتاحة الوصول وإعادة الاستخدام للبيانات لا يستلزم 
بالضرورة العمل على نموذج مفتوح (انظر الفصل الثالث)» ولكن ينبغي أن يتم ضمان توافر 
البيانات في المستقبل للمجتمع المستهدف بطريقة قانونية (2012 ,005105)). إن المجتمع 
المستهدف هو عادة مجموعة معينة من العلماء أو ا لمتخصصين في مجال السياسات الذين 
لديهم فى العادة احتياجات محددة اما من البيانات. ومتظلبات وظيفية ودعم مما يعنى 
أن حلول الأرشفة العامة ستكون ذات فائدة محدودة (2013 .|إجa‏ ¢ .(Lauriault‏ 

ومن ثم» فإن محفوظات البيانات ليست مجرد مخازن بيانات أو أنظمة نسخ احتياطي 
(والتي تحفظ البيانات في حال حدوث أعطال على المدى القصير مثل عطل الوسط التخزيني 
أو الفشل التقني). ولكنها تخططء وتنسّقء وتدارء وتوظف بفعالية من قبل موظفين 
متفرغين ومتخصصين يعملون على إضافة القيمة وضمان الاستمرارية. فهؤلاء الأفراد. إضافة 
إلى الكيان الإداري الوظيفي» مسؤولون عن الأرشفة إضافة إلى ثلاث مجموعات أخرى من 
الأطراف الفاعلة فى عملية الأرشفة وهم: منتجو البيانات» ومستهلكو البيانات» والإدارة 
85S 2012(‏ )). فاممنتجون هم منشئو البيانات أو الكيان القانوني المسؤول عن إنتاجها؛ 
أما المستهلكون فهم مستخدمو ا محفوظات. وأصحاب ا لمصلحة المعنيون بها أو مجتمع معين؛ 
وأما الإدارة فهي الهيئة التي تشرف على العملية. وتوفر للأرشيف ميثاقا ونطاقاء ولكنها لا 
تأخذ ! نشطا à‏ عمليات الأرشفة البومية (2013 .(CCSDS 2012; Lauriault et al.‏ 
وتشكل هذه الدوائر مجتمعة كيفية بناء وتشغيل وتطوير الأرشيف مع مرور الوقت. 
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في المقابلء فإن حاويات البيانات هو مجموعة غير رسمية وغير نظامية من البيانات. 
وقد يعتد بعض منتجي البيانات أن النسخ الاحتياطي أو أنظمة التخزين تشكل محفوظات 
أرشيفية بحكم الواقع» ولكنها تفتقر إلى الجهاز المؤسسيء» والتنظيم» والسياسات الرسمية 
النظامية (بالنسبة إلى امعاييرء وإتاحة الوصول إليهاء وإمكانية إعادة استخدامهاء وحقوق 
املكية الفكرية: والمعايير الأخلاقية: وإلى آخره): وما يطمح إلى تحقيقه الأرشيف (2111121116.] 
.(etal. 2013‏ فقد تكون حاويات السانات منتظمة وموجّهية: ولكن بدون قواعد صارمة 
أو أي خطط طويلة المدى تتعلّق بالمحافظة على البيانات وحفظهاء ودون أي التزام لمشاركة 
البيانات وتبادلها أو جعلها متاحة لإعادة الاستخدام. وعلى الرغم من أن حاويات البيانات 
قد تلتزم بشكل جيد بمعايير البيانات المتوقعة:. إلا أن هذا الالتزام يفتقر إلى الاعتماد 
والمصادقة عليه ويفتقر إلى الوثائق الأخرى والبيانات الوصفية المناسبة. 

وقد فقدت معظم البيانات التي تمّ إنتاجها على مر التاريخ أو دُمَرتَ بسبب تخزينها 
في حاونات بيانات] ولت أرشيفاء أوالأنه تقرر الحفاظ على اللُعلومَات المستقاة من هذه 
البيانات (مثل المقالات والكتب) التى كانت تعد أكثر قيمة. وتخزينها في المكتبات. وبشكل 
als‏ تم الإبقاء فقط على مجموعات البيانات الأكثر قيمة» مثل تلك ال مرتبطة بالمساعي 
العلمية والثقافية الأساسية والسجلات الحكومية: والمعاملات الاقتصادية: والعقود القانونة. 
s‏ حالات النماذج؛ الفنونء الكائنات ....إلخ والتي يمكن اعتبارها صورا معينة من البيانات 
فقد تم تنسيقها وتخزينها بالأساس في المتاحف وصالات العرض جنباً إلى جنب مع البيانات 
الوصفية ال مرتبطة بها. وقد تم تخزين البيانات الخاصة معظم العلماء بشكل غير رسمي 
على ملفات وصناديق أو على مختلف محركات الأقراص الصلبة في مكاتبهم أو في منازلهم. 
وعندما يتقاعدون خارج الخدمة أو يتوفون يتم تدمير معظم آثارهم.: ومعهم أي بيانات 
قاموا بإنتاجها. كما أن الغالبية العظمى من البيانات التي تم إنتاجها لأطروحات الدكتوراه 
تفقد بعد الانتهاء منهاء وغالباً لا يتم نشر حتى المعلومات المستقاة من البحوث. وعلاوة 
على ذلك فإن مُمَوَلِي البحوث تاريخيا لم يطالبوا المشاريع التي قاموا بتمويلها بحفظ 
البيانات وتخزينهاء أو إن طلبوا ذلك فقد كان لفترة قصيرة من الزمن. وكما هو الحال في 
العديد من اممشاريع التي مولها الاتحاد الأورويء دش ةط الاحتفاظ بجميع مواد ال مشروع 
ما في ذلك البيانات طمدة سبع سنوات» ولكن مكن بعد ذلك التخلص منهاء وهو ما يتم في 
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كثير من الحالات. بسبب تكاليف التخزين والظن الغالب بأن المقالات الورقية الناتجة تمثّل 
قيمة أكير. 

ومع تطور حلول التخزين الرقميء التي قللت التكلفة والمساحة التخزينية للاحتفاظ 
بالساناتء فقد بدأ التخزين الطويل الأمد على نطاق واسع للبيانات الاعتيادية المنخفضة 
التكلفة (انظر الفصل الخامس). فقد ظهرت أولى قواعد البيانات الرقمية التي ضمت 
مجموعات البيانات في الخمسينيات والستينيات من القرن الماضي وكانت تنسق البيانات 
في هياكل مسطحة أو هرمية منظمة (2012 2:156011). ومع ذلكء فقد كانت هذه 
الترتيبات غير فعالة للبحث والاستعلام عن البيانات» كما تم تطوير قواعد البيانات العلائقية 
«I.I (Relational databases)‏ في عام 117١‏ من قبل إدغار كود (Edgar Codd)‏ 389 
نظم خصائص البيانات المميزة (©؛ناط4]]1) فى مجموعة من الجداول المترابطة. حيث يتشارك كل 
جدول بحقل بيانات واحد على الأقل مع جدول آخرء فعلى سبيل المثال: قد يكون رقم الضمان 
الاجتماعي هو الحقل المشترك بين جدولين (المفتاح التأشير 6- Usa» (Indexical Key‏ $9200 
على التفاصيل الشخصية (مثل العمرء الجنسء الحالة الاجتماعية: والعنوان) ويحتوي الجدول 
الاخر على المتعلقات اماليةء ويسمح رقم الضمان الاجتماعي بربط البيانات للاستعلام à‏ 

كلا الجدولين la‏ وإنتاج بيانات جديدة مشتقة منهما. وإذا كان ا لمفتاح امشترك عنوانا 
أو تاريخا. فيمكن عندها وضع السبانات جغرافيا أو ERU hj‏ قواعد السانات 
العلائقة تنظيها قا Les‏ أكثر فعالية قدا عن البيانات الهيكلية باستخدام لغات 
Lá (SQL) 5,4! eXsz NI‏ إلى جنب مع قواعد البيانات العلائقية.ء سمح تطوير 
البيانات e Ax» (Spreadsheets) 4s!‏ وتخزين كميات كبيرة من البيانات الحسابية 
إضافة لتطبيق الصيغ وال معادلات عليها مما يؤدي إلى إنتاج بيانات مستقاة جديدة. وقد 
استكملت هذه الأشكال من قواعد البيانات: في السنوات الأخيرةء بقواعد البيانات غير 
الهيكلية (بلا استعلام -NoSQL‏ التى ممكنها التعامل مع كميات كبيرة من البيانات غير 
الهيكلية (انظر الفصل الخامس). 

ويكون انشاء ونمو مجموعات السانات 7 في الحالات التي تنتج فيها البيانات ابتداء 
بصورة رقمية (نشأت بالكود !27 (binary code-(3L‏ واا بطرق تلقاشة ومؤتمتة. كما 
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أنها عرضة للخسارة بشكل كبير بسبب التقادم في البرمجيات والمعدات. وقد بين 011::ه0”0 
sel and Webb (2012)‏ «في حين بمكن لأي أحد التقاط كتاب كتب قبل مئة سنة: والنظر 
فيه» وقراءة صفحة منه» فإنه لن يكون ذلك با مثل صحيحا لقرص مرن يحتوي على ملفات 
نصية لبرمجيات وورد بيرفكت أنشئت قبل ٠١‏ سنة فقط». وف المقابلء ينبغي أن تحوّل 
الأشكال التناظرية/ التمائلية لديانات الى الصورة الرقمية الثنائية على سيل uo «JU‏ 
ضوئيا أو إعادة تسجيلها وإدخالهاء والتي يمكن أن تكون مكلفة وتستغرق وقتا طويلا 
على الرغم من إمكانية أتمتة هذه العملية Ui‏ الى حد ما. وقد حدت التكاليف والنفقات 
المرتبطة بالرقمنة SII Euo cyo (Digitisation)‏ المادية:. وقت ال موظفين, وا لملعدات 
ا متخصصة: من تطبيقها في العديد من المحفوظات الأرشيفية التناظرية التي تحتفظ بها 
المتاحف والمكتتات والمجموعات الشخصية الخاصة. وبينما كافحت هذه اللؤسسات لتمويل 
أنشطة الرقمنة؛ فإن جهات خيرية (http://archive.org) ouy ày] Jis douj yé‏ 
وتجاريهة مثل قوقل )6٥٥81٤(‏ تساعد على Jie eL3Jl‏ هذه الأنشطة وذلك باستخدام 
مواردهنا الذاتية أو تبرعات المحسنين من عافة الأفراد مما zan) bla dobs Lyles‏ 
(انظر الفصل الخامس). 

وفي جميع الحالات» فإن البيانات ضمن حاويات البيانات الرقمية وا محفوظات الأرشيفية 
مكن مشاركتها وإعادة استخدامها بسهولة وبتكلفة هامشية منخفضة: وذلك على الرغم 
من أنه من الممكن الحدٌ فيما يتعلق بالوصول وإعادة الاستخدام بواسطة سياسات حقوق 
امملكبة الفكرية. وعلاوة على ذلكء فإنه من ال ممكن معالجتها وتحليلها من خلال الأدوات 
الحسابية القوية: إذ أصبحت الإجراءات والحسابات التي كان من الصعب القيام بها يدويا 
أو باستخدام التقنيات التناظرية على سبيل المثال. المسطرة الحاسبة التناظرية (51106 
4Sa (rules‏ $ غضون بضعة أجزاء من الثانية: وأكثر في بناء واختبار النماذج وأنظمة 
ا محاكاة المعقدة. کا E PAEPAE RER PAC PAIR PE SN EA‏ 
دسهوله تسسا ومدّها إلى أشكال أخرى من البنى التحتية للسانات. 


فالبنية التحتية للبيانات هي الوسيلة المؤسسية وامادية والرقمية لتخزين وتبادل 
واستهلاك البيانات عبر التقنيات المرتبطة بعضها ببعضء وعلى مدى العقدين الماضيين على 
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وجه الخصوصء» فقد تم بذل جهد كبير لتطوير وتعزيز هذه البنى التحتية» والتي تأخذ 
عدة أشكال: الكتالوجات» والآدلة» والبوابات» ومراكز تبادل المعلومات» والمستودعات» 
وا مستودعات الرقمية الموثوقة. والسنى التحتية السيرانية Cyber-Infrastructures)‏ 
.(Lauriault et al. 2007‏ وغالنا ما تستخدم هذه ال مصطلحات بالتبادل ويجري الخلط 
بعضها ببعضء وذلك على الرغم من أنها تمثل أنواع مختلفة من الكيانات (انظر الجدول 
2-2 على سيل المثال). 

فالكتالوجات. والأدلة. والبوابات هي موارد مركزية تفصّل وتربط حاويات البيانات 
وا لمحفوظات الأرشيفية التي تحتفظ بها المؤسسات على المستوى الفردي. وقد توفر قوائم 
مفصلة إلى حدّ ما عن مجموعات البيانات التي تضمّهاء كما يمكن أن تكون بمثابة مجاميع 
للبيانات الوصفية. ولكن لا يستضيف الموقع نفسه البيانات (2013 .21 ]© 0211011 0). 
أما مستودع البيانات أو مركز تبادل المعلومات فهو مكان مشترك لتخزين حاويات البيانات 
وامحفوظات الأرشيفية والوصول إليها. وقد توفر هذه ال مستودعات واطراكز بعض خدمات 
البيانات من قبيل البحث والاسترجاع: وإدارة البيانات ومعالجتهاء ولكن عملية إنتاج كل 
حاوية أو أرشيف تتم بشكل مستقلء ولذا فهي رما تفتقر إلى صيغ ومعايير وبيانات وصفية 
وسياسات مشتركة للبيانات. ومع ذلك» يسعى مستودع البيانات لضمان التزام كل أرشيف 
أو حاوية بمجموعة من المواصفات المطلوبة ويقوم بالمراجعةء والتدقيقء والتصديق على 
منح الشهادات لضمان سلامة البيانات وتعزيز الثقة بين المستخدمين )2012 (Dasish‏ 
وعرف )2013( o eg O'Carroll et al.‏ ال مستوعات. مستودعات اموقع الواحد التي 
تستضيف كافة مجموعات البيانات في موقع واحد» و هكن الوصول إليها من خلال واجهة 
على شبكة الإنترنت» على الرغم من إمكانية احتفاظها بنسخ احتياطية أو مواقع مثيلة في 
أماكن متعددة. والمستوعات المتعددة المواقع التي تستضيف البيانات ضمن هيكل موحد 
يسمح بالوصول إلى مجموعات البيانات القائمة في عدد من امواقع المؤسسية. 


فاطمستوع الرقمي !554 35( (TDR - Trusted Digital Repository)‏ هو مستودع 
مرخص بموقع واحد أو متعدد ال مواقع تتمثل مهمته في توفير وصول آمن وموثوق به 
للبيانات التى يديرها على المدى البعيد (2002 0٤1٤‏ 4ه ۸16). ومن أجل التأهل 
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كمستودع موثوق. فصلت )5 :2002( RLG and OCLC‏ الخصائص ال مطلوب توفرها في 
البنية التحتية لهذه المستودعات وهي كالتالي: 
٠‏ تقبل المسئولية عن الصيانة طويلة الأمد للموارد الرقمية بالنيابة عن المودعينء وما فيه 
مصلحة ال مستخدمين الحاليين والمستقبلين: والمستهلكين أو ال مجتمعات ا معنية. 
e‏ امتلاك نظام مؤسسي لا يدعم فقط استمرارية نظام المحافظة على البيانات على المدى 
البعيدء ولكن يحافظ أيضا على المعلومات الرقمية التي تقع ضمن نطاق مسؤوليته. 
0 توصيح امسؤوله اطاليه وضمان الاستدامة. 
تصميم أنظمتها وفقا للاتفاقيات والمعايير المقبولة وا معتمدة لضمان الإدارة المستمرة 
والوصولء وأمن امواد المودعة داخلها. 
٠‏ وضع منهجيات لتقييم المستودع. وذلك للتأكد من تلبيته للتوقعات ال مجتمع Cum Qa‏ 
الموثوقية. 
« إمكانبة الاعتماد على النية التحتة الخاصة بها وضمان تحمل مسؤوناتها على المدى 
الطويل تجاه المودعين والمستخدمين بشكل علني وصريح. 
ولكي بمكن لملستودع ما الحصول على هذه المتطلبات» RLG and OCLC oasi‏ 
cM 45| (2002: 13)‏ أن يكون متوافقا مع النموذج امرجعي لنظام امعلومات الأرشيفي 
امفتوح )2012 ils (OAIS Open Archival Information System-)(CCSDS‏ متلك 
وأمن النظام: والمساءلة الإجرائية. وتساعد كل هذه الخصائص معا على ضمان وبناء الثقة 
ع السانات ومستودعها. 
Ll juul daoil dal LaSi‏ 5 من مجرد مجموعه من ال محفوظات الأرشيفية 
الموتوقه 28$( کن مں تىادل السانات à 3L LZ ls‏ موارد à JI‏ التحشة dhal‏ الثمن. 
وتتألف dul‏ التحشة السيرانية من محموعه 4 متكاملة من امعدات daal‏ والتقنيات 
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الشبكية (تشمل المراصد وال رافق البحشة التجريبية: وشبكات الاستشعارء وما إلى (EUS‏ 
والخدمات والأدوات لرمجيات التشغيل المتبادل والبرمجيات الوسيطة: والخدمات ا مشتركة 
(المتعلقة بإدارة البيانات ومعالجتها). وأدوات التحليل مثل التمثيل البصري للبيانات 
ule)‏ سبيل اممثال» تطبيقات الرسوم البيانيه ورسم الخرائط )» والسياسات المشتركة (فيما 
يتعلق بحق الوصول للبيانات واستخدامها وحقوق الملكية الفكرية» وغيرها) التي تمكن 
من نشر البيانات وتوزيعهاء وربطها بعضها مع بعض وتحليلها (هيئة البنية التحتية 
السيبرانية 2007 .(Cyberinfrastructure Council‏ كما تسعى إلى تعزيز تنمية ال مجتمع 
التقاق الذي يدعم التعاون ال مباشر بين الأفراد متجاوزا الحدود الجغرافية واطمؤسسية 
hig .(Cyberinfrastructure Council 2007)‏ تستخدم bloi‏ لوصف البنية التحتية 
التي تمكن عمل مستودع بيانات موحد, فإنها تستخدم هنا للدلالة عاى البنية التحتية 
للبيانات التي تتشارك في مواصفات تقنية مشتركة متعلقة بالنماذج: والمعايير: والبروتوكولات. 
وبعبارة أخرى» هناك قواعد صارمة متعلقة بتطبيق المعايير على البيانات والالتزام بها داخل 
البنية التحتية. وتشمل مثل هذه البنى التحتية السيبرانية تلك التي تنفذها الوكالات 
الإحصائية الوطنية والبنى التحتية اممكانية الوطنية للبيانات» إضافة إلى البنى التحتية 
العلمية واسعة النطاق التي تتعلق بأبحاث الجينات» وعلم الفلك. والأرصاد الجوية وغيرهاء 
والتي تتطلب تخزين كافة البيانات ومشاركتها مع الامتثال لمعايير محددة من أجل تحقيق 
أقصى قدر من قابلية التشغيل البيني للبيانات وضمان جودة البيانات: والإخلاص والنزاهة 
التي تعزز الثقة. وهذه الأخيرة لها أهمية خاصة في مجال العلوم. والسياسات التي تقوم 
على أساسها مثل تتبّع تغيرات المناخ وتنبؤاتة» حيث تعد سلامة البيانات أمرا بالغ الأهمية 
في المناقشات الجارية حاليا. 

وإضافة إلى بوابات البيانات؛: والمستودعات. والبنى التحتية. تم استحدات عدد من 
المنظمات والهياكل المؤسسية التي تقدم المشورة بشأن أفضل ال ممارسات في مجال الحفظ 
الرقمي» وإتاحة ومشاركة البيانات» والتحقق من صحة العمل وامعايير المتعلقة بالاأنواع 
امختلفة من بنوك البيانات: والدفع باتجاه تنميتها وتطويرهاء وتنسيق الجهود ال مختلفة 
بشأن ذلك (انظر الجدول 2-3). وتؤدي هذه المنظمات والهياكل المؤسسية عملها من خلال 
أنشطة عدة مثل تقديم البرامج التدريبية والتعليمية» واستضافة الندوات والمؤتمرات» وإنتاج 
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الكتيبات والأدلةء وتوفير التمويل اللازم ممبادرات محددة. وتكتسب هذه المنظمات أهمية 
نظرا لإسهاماتها في خلق مجتمعات الممارسة بين مختصي البيانات» وتسهيل المفاوضات بين 
الهيئنات وتوسيع نطاق الجهود المؤسسية. ووضع مبادئ توجيهية ومعايير مشتركة. ويركز 
بقية هذا القتسم على مستودعات البيانات البحثية والبنى التحتية. ويفصّل في الأسس 
المنطقية لها والتحديات التي تواجههاء كما ستتم مناقشة البنى التحتية الخاصة والمتعلقة 
بشركات البيانات التجارية في وقت لاحق في هذا الفصل. 
جدول رقم (Y-Y)‏ 
أنواع وأمثلة البنى التحتية للبيانات 


النوع الأمثلة 


يُطلق على مجموعات غير رسمية من ملفات البيانات التي تكون على جهاز حاسب 


حاوية Data Holding 5L!‏ 
شخصيء ويسمى نظام النسخ الاحتياطي في بعض الأوقات. 








أرشيف لونفي لبيانات (LONI Image Data Archive-IDA) 554Jl‏ هو أرشيف 
آمن لصور الجهاز العصبى والسانات السريرية الطبية ذات الصلة بالمشاريع البحشة 
في جميع أنحاء القارة الأمريكية الشمالية والقارة الأوروبية. 


محفوظ السانات 







(أرشيف السانات) 12248 
Archive‏ 
أرشيف الموسيقى العالمية الموجوذ في مكتبة موسيقا )59( (Loeb)‏ في جامعة 
هارفارذ الذي يقدم تخزيناً آمنا M uci‏ متاحا لحتوى الأرشيف والتسجيلات 
التجارية الصوتية والمرئية للموسيقى من جميع أنحاء العام. 


«obl JI الكتالوجات» الأدلةء‎ 


تمكن خدمة البيانات الوطنية الأسترالية المستخدمين من تصفح أكثر من أربعمائة ألف 
البيانات الوصفية» والمجمّعون | من مجموعات البيانات وأكثر من ثلانمائة ألف مشروع تقوم بإنشاء مجموعات البيانات. 
تتيح المكتبة الرقمية العامة الأمريكية الوصول إلى مليونين وخمسمائة ألف سجل من 
سجلات السانات الوصفية من مكتبات» ومحفوظات» ومتاحف مقرها الولايات المتحدة. 


Catalogues , Directories 
, Portals , Metadata , 


Wg å CU ALÀ . s 2 7 i Aceregators 
يوروبيانا هي بوابة إلكترونية ومجمّع للبيانات الوصفية لأكثر من مئة وثلاثين من‎ ggreg 


المكتبات والمتاحف وال مكتبات الرقمية للوسائط المتعددة في جميع أنحاء أوروبا. 


محفوظات بيانات المجلس الأوروبي للعلوم الاجتماعية (0155514©) هي 
بوابة إلكترونية ومجمع للبيانات الوصفية منذ ما يزيد عن ثلاث وعشرين سنة 
لمستودعات البيانات الأوروبية الإحصائية للعلوم الاجتماعية التي تضم أكثر من 
مانية وعشرين آلف من مجموعات البيانات. 
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خدمات أرشفة وشبكات البيانات (104715) هو الأرشيف الوطني الهولندي 
لبيانات البحوث الرقمية. إضافة للأرشفة. وتقذه المبادئ التوجيهية للتدريب 
والاعتماد. 


أرشيف بيانات المملكة المتحدة (1712104) هو مستودع بيانات ال موقع الواحد 
لبيانات بحوث العلوم الاجتماعية والإنسانية الممولة من قبل مجلس البحوث 
الاقتصادية والاجتماعية (8510): ولجنة نظم المعلومات المشتركة (:150[)»: 
وجامعة إسيكس (Essex)‏ 


المستودع الرقمي الايرلندي (10181) هو مستودع رقمي موثوق للبيانات 
المعاصرة والتاريخية» الاجتماعية والثقافيةء وتقوم عليه المؤسسات الأيرلندية: 
ويوفر إتاحة الوصول: والحفاظ على البيانات للجهات المعنية ذات المصلحة 
واكتشافها. 


أوبونير (Openaire)‏ هو مستودع رقمي متعدد المواقع للحصول على البيانات 
العلمية المفتوحة في منطقة البحث الأوروبية المكوّنة من واحد وأربعين منظمة 
VOTE Wg‏ بلدا WM‏ 

المكتبة الرقمية لتكساس pyd (TDL)‏ مجموعة من مؤسسات التعليم العالي 
التي توفر منصة وخدمات مشتكة لتوفير الوصول المفتوح للبيانات والحفاظ 
عليها. 


توفر البنية التحتبة للسانات الجغرافية المكاننة الكنذية (0©6721©) 
الوصول ال موحد واممتسق» والدقيق» والقابل للتشغيل المتبادل للبيانات 
المكانية عير القطاعات والنطاقات الكندية. 





الفصل الثاني 


مستودعات بيانات ا لموقع 
الواحد 


Single-site Repositories 


مستودعات Olo‏ متعددة 
المواقع 


Multi-site Repositories 


البنى التحتية السيبرانية 


Cyber- Infrasrtuctures 


المصدر : مقتس بتصرف من .O'Carroll et a!.(2013)‏ 
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جدول (Y-Y)‏ 
السانات واتاحتها للوصول والمشاركة وإعادة الاستخدام في العلوم الاجتماعية والإنسانية 


dod 


The Federation of All European www.allea.org الأكادميات‎ zar dadl 
(Academies (ALLEA الأوروسة‎ 


المحفوظات الصوتية 
البريطانية والايرلندية 





British and Irish Sound Archives 
((BISA 


www.bisa-web.org 








الاتحاد الأوروبي لمحفوظات 
البيانات للعلوم الاجتماعية 


Consortium of European Social Science www.cessda.org 


Data Archives 





(Coalition for Networked Information (CNI www.cni.org التحالف من أجل معلومات‎ 


مارا( 


موارد اللغة ال مشتركة www.clarin.eu dilg‏ 
التحتية التقنية 









Common Language Resources and 


(Technology Infrastructure (CLARIN 


Committee on Data for Science and www.codata.org لجنه البيانات للعلوم‎ 
للعلوع‎ 


Digital Services Infrastructure for Social www.dasish.eu الخدمات الرقمية للبنية التحتية‎ 
(Sciences and Humanities (DASISH للعلوم الاجتماعية والإنسانية‎ 


(Digital Curation Centre (DCC الرقمى‎ Shs ركد‎ 
(Digital Library Federation (DLE www.diglib.org اتحاد الممكتبة الرقمية‎ 
(Digital Preservation Coalition (DPC www.dpconline.org تحالف الحفظ الرقمى‎ 


(Digital Production Partnership (DPP الشراكة للإنتاج الرقمي‎ 


Technology of the International 


Council for Science 








digitalproductionpartnership. 





co.uk 
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International Federation of Television www.fiatifta.org الاتحاد الدولي المحفوظات‎ 
(Archives (FIAT/IFTA Os» 5ALJI 


[International Association for Social www.iassistdata.org الرابطة الدوليهة لخدمات‎ 
Science Information Services and المعلومات والتكنولوجيا‎ 
(Technology (IASSIST للعلوم الاجتماعيه‎ 


ES 


International Association of Sound and www.iasa-web.org الرابطة الدولية‎ 
والسمعية - البصرية‎ 





Audiovisual Archives 








Inter-university Consortium for www.icpsr.umich.eda/ 


(Political and Social Research (ICPSR icpsrweb/ICPSR 


اتحاد الجامعات للىحوث 

السياسية والاجتماعية 
شبكة الخبرة في التخزين 

على ا مدى الطويل للموارد 


الرقميه 


مؤسسة الكواكب المفتوحة 


org 


امصدر : مقتيس بتصرف من 2013( .(O'Carroll et al.‏ 


Network of Expertise in Long-term | www.langzeitarchivierung.de/ 


(Storage of Digital Resources (NESTOR | /Subsites/nestor/DE/Home 








Open Planets Foundation www.openplanetsfoundation. 


الأسس المنطقية للبنى التحتية للبيانات البحشة: 

بالنظر إلى أن بناء البنى التحتية للبيانات هي ممارسة ليست باليسيرةء ومكلفة من حيث 
ا موارد والوقت الذي يستلزمه إنشاؤها والمحافظة عليها بشكل مستمرء فينبغي أن تكون 
هناك أسباب معتبرة لإجراء مثل هذا المسعى وال مضي فيه. ويستعرض الجدول (7-6) قائمة 
لأكثر من ثلاثين من هذه الأسباب مقسمة على ثلاثة أبعاد - مباشرة / وغير مباشرةء وفي المدى 
القريب / وعلى امطدى البعيدء والعامة / والخاصة بحسب .Beagrie et al. (2010) 1a» s‏ 
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ويمكن أن تترجم هذه الأسباب تقريبيا إلى المكاسب العلمية والمالية» والتأثير التراكمي للفوائد. 
والمستفيدين من هذه البنى التحتبة. 

وتتمحور المناقشات والحجج العلمية لتخزين» ومشاركة: وتوسيع البيانات داخل البنى 
التحتية للبيانات حول وعود من الاكتشافات والابتكارات الجديدة من خلال الجمع بين 
مجموعات البيانات والتوظيف الجماعي للعقول المشاركة. فمجموعات البيانات الفردية 
ذات قيمة في حدّ ذاتها. ولكن عند ضمّها جنب إلى جنب مع مجموعات بيانات أخرى 
أو تفحصّها بطرق وأساليب جديدة: فإن رؤى وأفكار جديدة من المحتمل أن تظهر 
وأسئلة جديدة من الممكن أن تتم الإجابه عليها (2007 0۲8١23١‏ 8). فبسبب الطبيعة 
التراكمية» من خلال الجمع بين مجموعات البيانات» مكن الزعم بتسارع وتيرة بناء المعرفة 
al. 2007)‏ © غ1112111اة.1). وعلاوة على ذلك. يصبح من الممكن من خلال الحفاظ على 
البيانات تتبع الاتجاهات والأنماط مع مرور الوقت» وكلما ازدادت فترة التسجيل للبيانات» 
زادت معها القدرة على بناء النماذج وأنظمة المحاكاة ومن ثم زيادة الثقة في الاستنتاجات 
التئ بتم التوصل إليها (2007 .(Lauriault et al.‏ لذاء فإنه ومع مرور الوقت» تزداد 
القيمة التراكمية المستودعات البيانات والبنى التحتية بحيث تصبح البيانات متاحة على 
نطاق واسع وبشكل أكثر يسراء وذلك من حيث النطاق والصلاحية الزمانية. 

ومن المرجح أن تعمل هذه المشاركة الاستراتيجية إلى بث روح التعاون بين الباحثين والفرق 
في التخصصات الجديدةء وتعزيز المهارات بصورة أكبر من خلال إمكانية الوصول إلى أنواع 
جديدة من السانات (2007 8015111312). وعلاوة على US‏ فإن تبادل اطعلومات واعتماد 
معايير وبروتوكولات وسياسات البنية التحتية من شأنه أن يرفع من مستوى جودة البيانات 
وأن يفسح المجال لأطراف أخرى لإنتاج بيانات مشتقة والتحقق من البيانات المتاحة» ومن 
ثم زيادة سلامة البيانات )2007 .(Lauriault et al.‏ كما تعمل البنى التحتية Ae T‏ 
إتاحة بيانات عالية الجودة في التعليم وتحسين المصادر التربوية والتعليمية لتدريب الجيل 
القادم من الباحثين. كما أن البنى التحتية للبيانات هي الوسيلة الوحيدة لإدارة البيانات 
وا مشاريع بكفاءة وفعالية في الحالات التى تعتمد فيها المشاريع العلمية بشكل كبير على 
أدوات تقنية المعلومات والاتصالات الباهظة الثمنء والتي ينتج عنها كميات هائلة من 
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الفصل الثاني 


البيانات» وكذلك ف المشاريع التى تضم فرقا بأعداد كبيرة من الباحثين المنتشرين في جميع 
أنحاء العام لتحليل هذه البيانات» لذا فإن البنى التحتية للبيانات تمثل الوسيلة الوحيدة 
الفاعلة والفعالة لإدارة مثل هذه النوعية من البيانات والمشاريع (2007 801812122). 

وتتمحور الفوائد المالية للبنى التحتية للبيانات حول الموازيين الاقتصادية التي تنشأ 
من خلال تقاسم الموارد ومشاركتها وتجنب تكرارهاء والاثار المترتبة على إعادة الاستخدام 
للبيانات المكلفة. والثروة الناتجة من خلال الاكتشافات الجديدة. وإنتاج مجتمعات 
أكثر كفاءة. فالبحث عملية مكلفة في العادة. حيث تنفق وكالات التمويل ال مختلفة 
بشكل جماعي مليارات الدولارات سنويا لتمويل النشاط البحثي. وينطوي جزء كبير من 
هذا النشاط على ازدواجية غير ضرورية في جهود إنتاج البيانات» ومعالجتهاء وإدارتهاء 
وتحللها. وندلا من إنشاء عدد كبر من المحفوظات الأرشيفية الخاصة. فإنه من المنطقي 
إنشاء عدد أقل Cono‏ التحتية ا مخصصة التى تقوم بتقديم وتحضير البيانات الأساسية 
على صورة A9 9a‏ وتنتج فعالية كبيرة في الجهد: KS‏ كذلك 0 أوسع للسانات 
للأفراد الباحثن والمؤسسات كون تكاليف الدخول إلى حقل أو مجال بحثي في العادة 
باهظة (2008 .(Fry et al.‏ وإضافة إلى ذلك. ستصبح عمليات ونتائج ا مشاريع dàou]‏ 
أكثر شفافية ويمكن الحكم على مدى تمثيلها القيمة مقابل ال مال. Sa dadha WSS‏ 
الهدر والحفاظ على الثمار الناتجة من هذه الجهود وتقاسمهاء فإنها ستعمل على تعظيم 
العائد من الاستثمار من خلال تمكين أكبر قدر من المكاسب التى يمكن الحصول عليها من 
.(Lauriault et al. 2007) SLLJI‏ فعلى سبيل امثال. قد ينتج عن إتاحة البيانات على 
نطاق واسع صناعات جديدة قائمة على ال معرفة وتكون شركات منبثقة ومنفصلة من خلال 
تسويق البحوث امموله من القطاع العام (ائتلاف العلوم 2013 «(Science Coalition‏ 
كما يمكن للبيانات ضمن البنى التحتية للبيانات أن تؤدي إلى طرق أكثر فعالية في الحوكمة 
والإدارة المجتمعبة. على سسيل المثال: توفر العديد من البنى التحتية للبيانات ال مكانية 
«d.i gl‏ إضافة إلى دعمها لليحوث الممكانيةء آدوات فعالة للإدارة واو الاقليمية: 
Si‏ من الاستعداد للطوارئ والاستجابة للكوارث بصورة أكثر فعالية: danse‏ التخطط 
بين الدول. 
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وبحسب ما تم إيضاحه من خلال النقاش حتى الان: فإن الفوائد ال محتملة ا مكتسبة 
من البنى التحتية للبيانات هي فوائد ممتدة وغير محصورة بالقطاع العام أو الخاص 
J—39 .(Beagrie et al. 2010)‏ ظهر Ld‏ في الواقع أن استراتيجية مشاركة السانات 
وتقاسمها تعود بالفائدة على < جميع الأطراف - الساحثينء المؤسسات» امممولن» واممؤسسات 
العامة والخاصة. فعلى مدى العقدين الماضيينء وبالنظر إلى المكاسب المتوقعة من مشاركة 
السانات وتبادلهاء عملت الوكالات البحثية للحكومات الوطنية والهيئات الاقليمية مثل 
الاتحاد الأوروبي. جنبا إلى جنب مع ال منظمات الخيرية» على الاستثمار بنطاق واسع في تمويل 
مجموعه كبيرة من امبادرات المختلفة. ومع ذلك وكما هو مبين olol‏ فهناك مقاومة ممثل 
هده المشاريعء وعلى الأخص من قبل الباحثين أنفسهم. ٠‏ ومن الواضح أنه على الرغم من 
أن هناك فوائد لا شك فضهاء فهناك أيضا تكاليف مرتبطة بإنشاء البنى OLLU daol‏ 


تحدبات بناء البنى التحتة للسانات: 

على الرغم من الفوائد المتوقعة والدركة من البنى التختية للبيانات: إلا أنها م تلق 
ترحيبا عالمياء كما أنها أثبتت صعوبة بنائها وتنفيذهاء فهناك مجموعتين رئيسيتين من 
القضايا الفاعلة - التقنية والاجتماعية/ السياسية - التى تعوق تطوير البنى التحتية للبيانات 
وتنميتهاء وستواصل القيام بذلك لبعض الوقت. 


جدول رقم (Y-€£)‏ 
فوائد مستودعات السانات والينى daxil‏ للسانات 
TAEA‏ 


إعادة تحديد الأهداف وإعادة استخدام البيانات. | انخفاض تكاليف المحافظة على البيانات في ال مستقبل. 





زيادة الإنتاجية البحثية إعادة توظيف البيانات للمهتمين الجدد. 
تحفيز أنواع جديدة من التواصل / التعاون. إعادة توظيف المنهجيات ال مستخدمة. 
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حي عاد ع الما لبك 


تحسين قاعدة المهارات. الأدوات والمعابير يحتمل أن تزيد من مستوى جودة 


الببانات. 








زيادة الانتاجية / النمو الاقتصادى. تقليل الاستفسارات العشواشة المتعلقة بالسانات 


التشت من البحث / سلامة البحث 


فوائد على المدى القريب الفوائد على المدى الطويل 
قيمة للباحث والطلاب الحاليين. تأمين القيمة للباحثين والطلاب المستقبليين. 


عدم فقدان البيانات بتغير الباحثين. إضافة القيمة مع مرور الوقت ونمو المجموعة 
وتطورها للحد الأقدى. 








توسيع إتاحة الوصول حيث التكاليف الاهظة | زياذة سرعة البحث والوقت el‏ لإدراك آثاره. 
للباحثين / اا مؤسسات. 





إعادة الاستخدام على المدى القصير للبيانات المنسقة | يحفز الأسئلة البحثية الجديدة: وبخاصة المتعلقة 
| بالسسانات المرتبطة والمشتقة. 


زيادة الوضوح / الاقتباس. الشفافية في تمويل البحوث. 


.Beagrie et al. 2010; Fry امصدر: 2008 31 اء‎ 
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E 
المكتبة الاقتصادية‎ 
والبنى التحتية للسانات» ووسطاء السانات‎ Se o 
خاضة‎ bia bios إن إنشاء بنية تحتة عاملة وقابلة للتشغيل المتبادل للبيانات ليس‎ 
إذا كان النظام موثوقاً ويقدّم مستويات مختلفة من إتاحة الوصول اعتماداً على تعريف‎ 
المستخدم وضمانات فيما يتعلق مصدر البيانات وسلامتهاء ونزاهتهاء وصلاحيتهاء فذلك‎ 
يتطلب تعاونا مكثفا وواسع النطاق واموائمة بين منتجى البيانات ومالي اممحفوظات‎ 
الأرشيفية فيما يتعلق بالتالي:‎ 
ه إجراءات إنتاج البيانات.‎ 
ماذج البيانات ومعايير البيانات.‎ o 
الببانات الوصفية والتوثيق.‎ ٠ 
ه إجراءات تحضير وتنقية وإدخال البيانات.‎ 
ه جودة السسانات وضمانها.‎ 
سياسيات الحفاظ على البيانات» والنسخ الاحتياطيء والتدقيق عليها.‎ ٠ 
البرمجيات والمعدات.‎ o 
ه أمن وحماية المعلومات.‎ 
سياسات الوصول» ومنح التراخيص» والاستخدام وإعادة الاستخدام والخصوصية,‎ o 
والجوانب الأخلاقية.‎ 
سياسة الملكية. وحقوق الطبع والنشرء وحقوق الملكية الفكرية.‎ o 
الترتيبات الإدارية وآليات تنظيم الإدارة والحوكمة.‎ ٠ 
تمويل البنية التحتية وخدماتها وإدارتها.‎ « 
(Borgmann 2007; Data Seal of Approval 2010; O'Carroll and Webb 2012) 
فالبنية التحتية للبيانات لن تنجح إلا إذا كان لديها رؤية طويلة الأجلء وهناك التزام‎ 
لإدارة ا محتوى نيابة عن المودعين والمستخدمين وتحمّل مسؤوليتهاء مع التطبيق التام‎ 
.(O'Carroll and Webb 2012) لجميع العوامل المذكورة أعلاه بشكل فعال‎ 
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فالقضايا التي تمت الإشارة إليها ليست مجرد قضايا تقنية» ولكنها أيضا اجتماعية وسياسية 
ذلك لأنها تتطلب التفاوض والاتفاق على طريقة تصميمها واختيارها ومتطلبات إدارتها 
القائمة بين العديد من الأطراف - الممولين:ء والمصممينء والمبدعينء واطديرين واطودععن. 
ومجموعات الضغط والتوجيه: والمساهمين وأصحاب المصالح الخاصة الأخرى - في سياق 
مختلف التعليمات» واللوائح» والقوانين المتعلقة بإنتاج» وتخزين» ومشاركة البيانات. ومن 
ثم. فهي تتشكل بواسظة الأجندات الشخصية والشخصيات. والقيم المؤسسية. والالتزامات 
والوصايات» والثقافات» والهياكل» والعمليات» والتمويلء والقضايا الحكومية: والتبعيات 
الإجرائية حيث أنه بمجرد أن يبدأ المشروع في مسار معين. فسيكون من الصعب غالبا توجيهه 
à‏ مسار مختلف LS‏ عنه )2007 .(Feenberg in Lauriault 2012; Lauriault et al.‏ 
كما يمكن أن يكون تجميع ومواءمة المحفوظات الأرشيفية المعتمدة على مسارات 4,235 
مختلفة عملية في غاية الصعوبة: وطويلة الأمد. ومكلفة لأنها تتطلب من تلك المشاريع 
إجراء تغييرات لتحديث بياناتها المتقادمة لتتوافق مع ا مواصفات المتفق عليها في الموائمة 
.(Lauriault 2012)‏ وهذا هو السبب ق اعتماد العديد من المشاريع الأرشفية على بنية 
مستودع البيانات بدلا من السعي لتصبح بنية تحتية إلكترونية/ سيبرانية. 

Los‏ بعد الصعوبات المتعلقة بإنشاء هياكل تبادل البيانات» إقناع أصحاب البيانات 
أنفسهم بتبادل سلعتهم الثمينة (بياناتهم): فهناك مبدأ أساسي في البحوث الأكاديممية وهو 
إتاحة الوصول ال مفتوح؛ معنى» أن جميع جوانب إنتاج المعرفة ينبغي أن تكون متاحة بحرية 
للآخرين لتفحصها ونقدها. وهذا ا مبدأ لم يُعمل به على النحو الأمثل أبداء إذ تختفى الأبحاث 
الأكادمية في الغالب خلف حواجز الأجور ويتردد الباحثون في مشاركة بياناتهم وتبدلها مع 
الآخرين. وكما أشار )2007( Borgman‏ فإن مشاركة البيانات وتبادلها شائع في عدد قليل 
من التخصصات مثل SLL aleg (Genomics) Slua ole (Astronomy) dall ale‏ 
العمرانية بهيئتها الرقمية (27©0122615) والتي تعتمد على فرق علمية كبيرة وموزعه جغرافيا؛ 
أما في التخصصات الأخرى فيجري فى أحيان نادرة مشاركة البيانات وقد لا تجري على الإطلاق. 
وقد Al Borgman cal2‏ أن «السر الصغير القذر» وراء تشجيع مشاركة البيانات» وتبادلها 
هو عدم التبادل لكثير من البيانات ف الواقع )1059 :2012 HY Wig .(Borgman‏ هناك 
عددا من المثبطات التي تحول دون تبادل البيانات ومنها: 
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البيانات الصغيرة: والبنى التحتية للبيانات» ووسطاء البيانات 
ه. عدم وجود مكافات للقيام رذلك. 
« الجهد اللازم لإعداد وأرشفة السانات. 
نقص الخيرة والموارد والأدوات اللازمة لأرشفة السانات. 
٠‏ مخاوف من القدرة على استخراج قيمة من البيانات قبل الغير» وذلك من حيث الأوراق 
العلمية وبراءات الاختراع» ونظرا للجهد المستثمر في إنتاج البيانات. 
o‏ المخاوف بشأن الكيفية التى سيتم بها استخدام البيانات. خاصة إذا كانت تتعلق 
٠‏ المخاوف بشأن الاستفسارات بخصوص إنتاج البيانات والطلبات التي من شأنها أن 
٠‏ مخاوف من القضايا المتعلقة بالكشف عن البيانات ونتائج البحوث التى يمكن تقويضها 
ه قضابيا الملكية الفكرية. 
٠‏ الخوف أنه لن يتم استخدام البيانات: وبالتالي تشكل الأرشفة جهدا ضائعا. 
Borgman 2007, 2012; Strasser 2013)‏ (. 
فمن الواضح أن ضمان السانات من خلال أرشفتها لإعادة استخدامها مستقلا سوف 
يتطلب أكثر من محرد انشاء مستودعات السانات والبنى daoil‏ لها؛ كون ذلك يتطلب 
تعدا ثقافا à‏ اممارسات PCI‏ ويتكشنف هذا التغيير للعبان باستخدام إستراتيصة 
52Jls LLasJl‏ )6( فمن ناحبة lu‏ استخدام الحوافز لتشجيع الباحثين على أيداع وتىادل 
البيانات» مثل تشجيع الاقتباس والإسناد عند إعادة استخدام البيانات )2012 (Borgman‏ 
وتوفير الأموال الكافة لأرشفة السيانات ضمن حوائز gi‏ ومن clu "T A. ob‏ وكالات 
الأبحاث في إجبار الباحثين على إيداع وتبادل البيانات» مع مراعاة الجوانب الأخلاقية وحقوق 
d Sal ASLI‏ كشرط لتمودل البحوث. 
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وسطاء السانات و الأسو :(Data Brokers and Markets) Jl‏ 
متلك القطاع الخاص دافعا مختلفا جدا لإنتاج وإعادة استخدام البيانات عن ذلك الذي 
عند الأكاد هيين» فالبنى التحتية للبيانات البحثية تسعى لتحقيق الصالح العام من خلال 
إنشاء مشاعات للبيانات لتسهيل وتشجيع تبادل البيانات وإعادة استخدامها. وف اممقابلء 
يلتقط وسطاء البيانات (يسمون أحيانا مجمعى أو مختزل أو بائعي البيانات) البيانات 
ويجمعونها معا ويعيدون تعبئتها (تحزمها) في البنى التحتيه للبيانات التي يمملكها القطاع 
الخاص لعرضها للإيجار (للاستخدام لمرة واحدة أو لاستخدامها تحت شروط الترخيص) 
أو إعادة البيع على أسس ربحية. وتشمل المنتجات قوائم العملاء/الزبائن ال محتملين 
الذين يستوفون معايير معينة (بما في ذلك تفاصيل مثل الأسماءء العناوين: أرقام الهاتف. 
وعناوين البريد الإلكتروني» وكذلك معلومات مثل «الجنس» العمرء العرق» وجود الأطفالء 
الدخلء قيمة المنزلء ملكية بطاقة الاثتمان» الوضع الائتمانى» آنماط الشراء والهوايات»؛ 
(CIPPIC 2006: ii)‏ والتدقيق على الخلفية الأمنية»ء ومجموعة من منتجات البيانات 
المشتقة التي أضاف لها الوسطاء قيمة من خلال التكامل» ومنتجات تحليل البيانات 
التي تستخدم في معظم الأحوال لحملات الدعاية والتسويق المصغرةء وتقييم الجدارة 
الائتمانية والتصنيف الاجتماعي للأفراد» وتوفير خدمات البحث عن المفقودينء وتقديم 
تحليلات الأعمال المفصّلة (2006 ©122510©). وفي حالة القوائم» فهي في معظمها مستأجرة 
as‏ كثير من الحالات لا يستلم ال مستأجر القانئمة. حيث يعمل مكتب خدمة كطرف ثالث 
على إعداد وإرسال البريد بالنيابة عنهم (2006 0128210). وبالمثلء مع تحليلات البيانات. 

حيث يتلقى العملاء نتائج تحليل البيانات» وليس ذات البيانات الأساسية. 

إن عمليات اختزال البيانات وإعادة بيعهاء وما يرتبط بها من تحليل للبيانات وخدمات 
ذات قيمة مضافة. هي صناعة مليارات الدولارات» مع كميات هائلة من البيانات والمعلومات 
امستمدة التي تؤجرء وتباع وتشتري بشكل يومي عبر مجموعة متنوعة من الأسواق - تجارة 
التجزئة: وا مالية» والصحة. والسياحة: والخدمات اللوجستنة:؛ والأعمال الذكية: والعقارات: 
والأمن الخاصء والاقتراع السياسيء وإلى آخره. وتتعلق هذه البيانات بجميع جوانب الحياة 
اليومية وتشمل الإدارة العامة. والاتصالات. واستهلاك السلع ووسائل الإعلام» والسفر 
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والترفيه»ء والجرهة» وتفاعلات وسائل التواصل الاجتماعية» وإلى اخره» فوسطاء البيانات 
المتخصصين هم متواجدون منذ فترة طويلهء يجمعون البيانات من اشتراكات وسائل الإعلام 
(على سبيل «JULI‏ الصحف» واطمجلات)ء وتجار التجزئة عبر طلبات البريدء واستطلاعات الرآيء 
والدراسات الاستقصائية: ووكالات السفرء وال مؤتمرات» والمسابقات» وتسجبلات وضمانات 
اطمنتجات» وشركات معالجة الدفع والسدادء والسجلات الحكومية» وإلى آخره CIPPIC)‏ 
(3s .(2006‏ السنوات الأخيرة» وخاصة منذ ظهور الإنترنت» توسعت هذه الصناعة بشكل 
سريع» مع التنوع قي البيانات التي تم التقاطها واختزالهاء والمنتجات والخدمات التي تقدمهاء 
وغالبا ما تجمع معا على حدّ سواء البيانات الصغيرة والكبيرة. 

فبيع البيانات للوسطاء أصبح بمثل تدفقا مهما للدخل للعديد من الشركات: فعلى سبيل 
المثالء يبيع تجار التجزئةء في كثير من aUe‏ البيانات المتعلقة بالعمليات مثل تفاصيل 
بطاقة الائتمان» ومشتريات العملاء وبرامج الولاء الخاصة بالمتجرء وإذارة علاقات العملاءء. 
ومعلومات الاشتراك. كما تبيع المواقع الإلكترونية بيانات النقر (الاختيارات) المتعلقة 
بكيفية تصفح شخص مالموقع على شبكة الإنترنت والوقت الذي يقضيه على مختلف 
الصفحات. وبالمثل تستخلص شركات وسائط الإعلام» مثل محطات الصحف والإذاعة 
والتلفزيون» البيانات الواردة في محتواها (على سبيل JELI‏ الأخبارء والإعلانات). وتستخلص 
شركات وسائط التواصل الاجتماعى البيانات الوصفية وبيانات المحتوى ممستخدميها 
وتستخدم هذه البيانات لتحديد ال مواصفات الأساسية للمستخدمين ومنتجات البيانات 
الخاصة بهم: أو بيع البيانات لوسطاء البيانات. على سبيل «JUL‏ تستخدم شركة فيسبوك 
املفات التعريفية للمليارات من مستخدميهاء وشبكاتهم الاجتماعية. والمحتوى الذي 
يقومون بتحميله (المفضلات. والتعليقات. والصورء والفيديوهات. وما إلى ذلك) لتمكن 
مجموعة من امنتجات الإعلانية مثل الإعلانات الموجهة للجماهر المتمائلة Lookalike)‏ 
925 والجماهيرر ال مخصصه المدارة (4110161©65 (Managed Custom‏ وفتات 
الشريك Categories)‏ 2216361) وذلك بالشراكة مع وسطاء البيانات الكبيرة والملسوقين 
مثل داتا لوجيكس (2ذع1236310): وأبسسلون (1102وم1), وأكسيوم S gbg (Acxiom)‏ 
(نهك1ءنا81) من أجل دمج بيانات الشراء الخاصة بهم التى لا تخص فيسبوك مع البيانات 
السلوكية التى يوفرها الفيسبوك (2013 1:018105). 
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فبطرق مختلفة: يتخلى الأفراد عن البيانات الشخصية الخاصة بهم: عن قصد أوعن غير 
قصدء وبدرجات متفاوتة: بصفة مشترينء أو مشتركينء أو مسجلينء أو أعضاءء dolo gl‏ 
بطاقات. أو مانحين» أو متسابقينء أو مشاركين في الاستطلاعات. أو حتى مجرد مستفسرين 
(11 :2006 ©01221©). وعلاوة على ذلك وحيث إن إنشاء. وإدارة» وتحليل البيانات هى 
مهمه متخصصهة: تستعين العديد من الشركات بجهات خارجية من شركات معالجة البيانات 
وتحليلاتها للوفاء بمتطلبات البيانات الخاصة بها. وتستطيع هذه الشركات» من خلال 
تقديم هذا النوع من خدمات البيانات لمختلف العملاءء بناء مجموعات بيانات واسعة 
النطاق» والتي يمكن الجمع بينها وحزمها لاستخدامها في إنتاج بيانات مشتقة جديدة: والتي 
بدورها توفر المزيد من الأفكار والرؤى مقارنة بتلك التى يمكن تحصيلها من مصدر واحد 
فقط للبيانات» وإضافة إلى هذه البيانات التى يحصل عليها وسطاء البيانات من القطاع 
الخاص» يعمل هؤلاء الوسطاء كذلك على الحصول على مجاميع بيانات القطاع العام سواء 
التي تتعلق بالأفراد أو تلك التي تخص مجموعة منهم كفئة معينة وأماكنهم مثل بيانات 
سجلات اطلكية والتعداد السكاني» كما يقومون باستئجار/ أو شراء القوائم المتعلقة بالأفراد 
من الجمعيات الخيرية والمنظمات غير الحكومية. 

ومن خلال تجميع البيانات من مصادر متنوعةء ينشيئ وسطء البيانات بنية تحتية من 
السبانات الضخمة والمترابطة» فعلى سبل اممتثال» تشتهر شركة إبسیلون J'Wzab (Epsilon)‏ 
بيانات عن ثلانمائة مليون بطاقة ولاء من أعضائها في جميع أنحاء العام إضافة إلى بنك 
معلومات يضم بيانات ذات صلة مئتين وخمسين مليون مستهلك ف الولايات المتحدة 
وحدھا (2013 .)٤4 ۷۲۵s‏ کما تشتھر شرکة آکسیوم (۳٥ا×٥4)‏ پإنشائھا بنكا للمعلومات 
يتعلق بخمسمائة مليون مستهلك فعّال في جميع أنحاء العام (تقريبا مئة وتسعون مليون 
شخصء ومئة وستة وعشرون مليون أسرة في الولايات المتحدة)» مع نحو ألف وخمسمائة 
معلومة عن كل شخص. وتنفذ خوادمها أكثر من خمسين تريليون عملية في السنة. وتجاوز 
إجمالي تدوير رأس المال للشركة المليار دولار )20122 lS. (Singer‏ تدير أيضا قواعد 
بيانات منفصلة؛ أو تعمل مع سبعة وأربعين شركة من كبرى الشركات المئة الأكبر ف العام 
.(Singer 2012a)‏ وتزعم شرکه olo Las 525 (Datalogix) (45.23) L5l3‏ متعلقه 
بمشتريات م تتم عن طريق الإنترنت تبلغ قمتها أكثر من 5 (Edwards 2013) jJs5 ùgh‏ 
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وتشمل شركات الوساطة والتحليل لليانات شركات أخرى مثل شركة الايانس داتا سبستمز 
«(eBureau) 55» ($15 «(Alliance Data Systems)‏ وتشويس بوينت (ChoicePoint)‏ 
(Experian) ob 515 (Equifax) (4555,55! 9 (Corelogic) 4.2 3)55$5‏ ای دی 
آنالاتکس «(Infogroup) à$,2523:5 «(ID Analytics)‏ وإننوفيس (Innovis)‏ وإنتليبوس 
«(Seisint) ss (Recorded Future) 5y w399 z9 (Intelius)‏ وترانز يونيون 
JS a 23s .(TransUnion)‏ شركة من هذه الشركات إلى التخصص فى elgi‏ مختلفة من 
البيانات ومنتجات البيانات والخدمات. فعلى سبيل امثالء» تقيّم شركة إي بيرو العملاء 
المحتملين بالنيابة عن شركات بطاقات الائتمانء والمقرضينء وشركات التأمين» والمؤسسات 
التعليميةء كما تقدم شركة إنتليوس خدمات البحث عن الأشخاص والتحري عن خلفياتهم 
(Singer 2012a)‏ 


cele JS os‏ فإن مبتغى وسطهء البيانات وشركات التحليل هو مجموعة واسعة من 
البيانات (الصغيرة والكبيرة)؛ والمتعلقة بأكبر شريحة ممكنة من olg GLI‏ تكون هذه 
البيانات مترابطة بشكل كبير ويمكن تمييزها (تحوي تعريف فريد) بحسب طبيعتهاء وكلما 
استطاع وسيط البيانات تصدير ودمج المزيد من البيانات» كان عمل منتجاته أكثر نجاحا 
وعلى النحو الأمثل. واكتسب ميزة تنافسية عن منافسيه الآخرين. ويمكن من خلال جمع 
السسيانات معا وهيكلتها بشكل مناسب لوسطاء السانات اشتقاق بيانات جديدة: وملفات 
تعريفية عن الأفراد والمناطق: والقيام بإجراء النمذجة التنبؤية لتوقع ما قد يفعله الأفراد 
في ظل ظروف مختلفة وق أماكن مختلفة. وهذا من شأنه أن مكن من تحديد ا مستهدفين 
وا مخاطر بشكل أكثر فاعلية بين مختلف المستهلكين وأن يُعطي مؤشرا على مدى التصرف 
ا محتمل لهؤلاء المستهدفين والدفع بهم لاختيار استجابة معينة (على سبيل المثال» اختيار 
وشراء عنصر معين). فشركة أكسيوم تسعى» على سبيل ال مثال» لربط البيانات غير المتوافرة 
«(Offline Data) —5;9VI (Je‏ والسانات المتوافرة على الإنترنت «(Online Data)‏ وحتى 
s (Mobile Data) à 1à::bl LUI‏ أجل تكوين نظرة شاملة متعددة الزوايا عن 
المستهلكين» حيث تستخدم هذه البيانات لإنشاء ملفات تعريفية مفصلة ونماذج تنبؤية 
متماسكة 2012a)‏ 5111861). فهذه ال معلومات والنماذج مفيدة T‏ لشركات الشراء لآنها 
تمكنهم من تركيز جهودهم امتعلقة بالتسويق واممبيعات» وتزيد من فرص نجاح عملياتهم» 
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في ذات الوقت الذي تمكنهم من الحد من النفقات من حيث الهدر والخسارة التي قد تنتج 
عن استثمارات محفوفة بالمخاطرء ومن ثم تسعى هذه الشركات لتصبح أكثر فعالية وكفاءة 
في عملياتها باستخدامها لمثل هذه المنتجات. 

ومن امثير للاهتمامء أنه بالرغم من امتلاك وسطاء البيانات وشركات التحليل لكميات 
كبيرة ومتنوعة من البيانات الشخصية التي تستخدم منتجاتها لتصنيف واستهداف الأفراد 
والأسر اجتماعياء فقد كان هناك نقص ملحوظ ف الدفع بالاهتمام النقدي لعمليات هذه 
الشركات. ففي الواقع. هنالك ندرة في التحليل الأكاديممي والإعلامي عن هذه الشركات 
والآثار المترتبة على عملها ومنتجاتها ويعود السبب في ذلك جزئيا إلى أن هذه الصناعة 
بعيدة عن الأضواء وسرية نسبياء ولا ترغب ق توجيه انتباه الجمهور إليهاء وزعزعة تقة 
الجمهور في أصولها وآنشطتهاء والتي قد تؤدي إلى حملات عامة للشفافية: وا لمساءلة. 
والتنظيم. فوسطاء البيانات بشكل عام غير منظمين إلى حد كبير في الوقت الحاضرء كما 
أنهم غير ملزمين قائونيا بتزويد الأفراد بإمكانية الوصول إلى البيانات المحفوظة عنهم: Js‏ 
هم ملزمون بتصحيح الأخطاء المتعلقة بهؤلاء الأفراد (20126 512861). وإضافة إلى أن 
بيانات ومنتجات هذه الشركات يمكن أن يكون لها تأثير عميق في الخدمات والفرص المقدمة 
للأفراد» مثل ما إذا كان سيتم تقديم عرض لفرصة عملء أو قبول تقديم طلب قرضء أو 
إصدار بوليصة تأمينء أو الموافقة على الاستئجار. وتكلفة السلع والخدمات المقدّرة على 
أساس المخاطر المتوقعة والقيمة بالنسبة لشركة ما (2002 1:8707آ). 

إن قلق البعض» من فيهم 2013) 1531111162 158:01]1) رئيسة لجنة التجارة الاتحادية 
Ssh SLY $ (Federal Trade Commission)‏ يتمثل في ممارسة هذه الشركات 
شكلا من شكال il (Data Determinism) SLLJI daio‏ لا يجري فيها فقط تصنيف 
الأفراد والحكم عليهم على أساس ما فعلوه: ولكن على التنبؤ بما قد يفعلونه في المستقبل 
باستخدام خوارزميات هي أبعد ما تكون عن الصحة والكمال» بحيث قد تحمل في ثناياها 
تحيزات تتعلق بالعرقء والإثنية. والجنسء والحياة الجنسية. وحتى الآنء فهم صناديق 
سودا ء كفتفر إل 'الرفانة المجدية والإجراةات اللعالجة: وفستهدع بنآنات متغفهة العودة 
على الأغلب» ومن ثم تكون عرضة للخطأً (انظر أيضا للفصل العاشر). وعلاوة على ذلك 
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فإن هذه الشركات تستخدم البيانات لغير الأغراض التي تم إنشاؤها لأجلهاء وبالتأكيد 
ليست لأغراض أولئك الذين تشير البيانات إليهم وتمثل ما قد يرغبون فيه فالذين يتقدمون 
ببياناتهم للحصول على بطاقة ولاء المتجر لا يتوقعون بالضرورة أن يتم بيع بياناتهم 
واستخدامها لأغراض تتجاوز علاقتهم مع المتجرء ولا يتوقعون استخدامها بطرق قد تعرضهم 
للعقاب وامحاسبة بعد ذلك (2013 183112162). وبينما يرحب بعض امستهلكين بالعروض 
الشخصية jo ll ys‏ أو الإعلانات الموجّهة على المواقع الإلكترونية. يعدها البعض الآخر 
تطفلا واستغلالية (Singer 2012a)‏ وعلاوة على ذلك. فإن كنز البيانات التى قد يكون 
لها قيمة في المستقبل كإجراء للمضاربة السوقيةء هو انتهاك لقوانين الحدٌ من البيانات التي 
تنص على وجوب الإيقاء على السيانات محددة القيمة فقط (2013 12169). ويعد sUa us‏ 
البيانات هدفا رئيسيا للمجرمين العازمين على الاحتيال وسرقة الهويات» وذلك بالنظر إلى 
حجم السجلات الشخصية الحساسة مثل الأسماء. والعناوين: وأرقام الهوية (مثل الضمان 
الاجتماعي» وجواز السفرء ورخصة القيادة): وأرقام بطاقات الائتمان المتوافرة لديهم. وفي 
الواقع» فقد تابعت لجنة التحارة الاتحاıة )Federal Trade Commission- FTC)‏ أكثر 
من أربعين قضية لخروقات أمنية خطيرة للبيانات» آغلبها ضد وسطاء البيانات» لفشلهم ف 
توفير ضمانات أمنية كافية على البيانات )2013 (Ramirez‏ 

وفي الآونة الأخيرة وفي أعقاب الخروقات الأمنية والكشف عن صفقات بيع مشبوهة 
واستخدام لبيانات حساسة )2013 dI lis (Dwoskin‏ جنب مع الكشف عن برنامج 
بريزم التجسسي لوكالة الأمن القومي (21215231 7154) ووصول الحكومة إلى سجلات تجارية 
jU3MJ áàLal (Greenwald and MacAskill 2013)‏ عن فضيحة قرصنة الهاتف العامي 
واستجواب ليفينسون (1.676501آ) في اممملكة !842 http://www.levesoninquiry.)‏ 
(org.uk‏ فقد انصب امزيد من الاهتمام على وسطاء البيانات وممارساتهم التجارية. ففي 
أواخر عام 2012ء استدعت لجنة التجارة الاتحادية تسعة من وسطاء البيانات لاكتشاف 
امزيد حول ماهية البيانات وامعلومات المستمدة منها التي يقومون بإنتاجها وجمعها عن 
الناس وكيفية توظيفهم هذه البيانات وطرق بيعهاء وأصدرت تقريراً يدعو للخصوصية 
عند التصميم (انظر الفصل العاشر)ء وخيارات مبسطة. وقدر أكبر من الشفافية (لجنة 
التجارة الاتحادية 2012 (Federal Trade Commission‏ وعلاوة على ذلك. فقد تم 


ثورة البيانات البيانات الكبيرةء والبيانات «áo 924b!‏ والبنى التحتية للبيانات» والنتائج المترتبة عنها ۹۱ 


AA 


المكتبة الاقتصادية 
ECONLIBRARY — usui Lie duisoJ! 6G‏ © 


الفصل الثاني 


تطبيق الضغط السياسي لاعتماد أنظمة أشذ رقابة وأكثر شفافية. أما في أوروبا. فيسعى 
قانون الاتحاد الأوروبي الجديد لحماية البيانات لتنظيم كيفية استخدام البيانات» ومنح 
امواطنين الحق في الوصول إلى البيانات والتنازع عليها والحق في تناسيها وحذفها (انظر 
الفصل العاشر). وسيعتمد مدى نجاح مثل هذه الأعمال على إعادة تشكيل أعمال وسطاء 
البيانات والذي سيحدثنا عنه الزمن لاحقاء وفي غضون ذلكء هناك العديد من الأسئلة 
المتعلقة بوسطء البيانات والأسواق وآثارها على المواطنين والمستهلكين التي تحتاج إلى 
استكشاف للإجابة عنها (انظر الفصل السادس). 


الخلاصة: 

على الرغم من الدعوات المنمقة لمؤيدي البيانات الكبيرة وأولويات التمويل للوكالات 
O A A‏ اة سس تمر بالنقاء تاعتبارهاا 18 ا ودا في فضاء البحث 
العلميء فدراسات البيانات الصغيرة قد تكون محدودة قي الحجم» ومحصورة من حيث 
عيناتها وتنوعهاء وثابتةء وغير مرنة. بمجرد تنفيذهاء ولكنها خدمت: العلوم بشكل جيد حتى 
وقتنا الحاضر لأنها مصممة خصيصا للرد على أسئلة مركزة بإحكام. ويتيح إنتاج البيانات 
الصغيرة, جنبا إلى جنب» مع أدوات التحليل الجيدةء للباحثين التنقيب الدقيق وبشكل فعَال 
à‏ مستويات محكمة من السانات العالية الجودة من أجل فهم العام. وق اممقابلء وكما 
نوقش ف الفصل الثامن. تسعى العديد من دراسات البيانات الكبيرة إلى الإجابة عن الأسئلة 
التي يمكن الإجابة عنها من البيانات المنتجة؛ فكما قيل: الذيل الآن هو الذي يهرّ الكلب. 

ومع ذلك. فمن الواضح أن رؤى وقيمة أكبر بكثير يمكن الحصول عليها من البيانات 
الصغيرة من خلال توسيع نطاقها في البنى التحتية للبيانات والاحتفاظ بها للأجيال القادمة. 
ds‏ حين أن البيانات ولفترات طويلة قد جُمعت معاء وجرى تخزينها وأرشفتهاء إلا أن 
تطور التقنيات الرقمية قد غير بشكل جذري قدرتنا على إدارة» وتنظيم: ومعالجة» وتحليلء 
ومشاركة: وإعادة استخدام البيانات. وخاصة تلك البيانات التي ولدت رقمية في الأصل. 
فقد كانت البيانات الصغيرة فيما سبق نادرة ومقيّدة: ولكنها غدت متوافرة بشكل أكير 
وأكثر انفتاحا (انظر الفصل الثالث). وبتوسيع نطاق هذه البيانات يمكن تحقيق جدوى 
اقتصادية وذلك فيما يتعلق بخدمات البيانات: وآدوات التحليل واطوارد التربوية» وتوضيف 
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البيانات في استخدامات جديدة: وإنتاج اكتشافات جديدة. sao OYI Jio eUI iog‏ 
كبير لإنتاج البنى التحتية للبيانات في جميع المجالات الأكادممية. وهو الجهد الذي من شأنه 
أن يُتيح بشكل أكبر بكثير البيانات للمجتمعات ال معنية وأن يُغيّر طبيعة عمل العلوم (انظر 
الفصل الثامن). 

ويتضح امدى الذي يمكن من خلاله لهذا التوسع إنتاج قيمة من خلال النمو السريع 
لقطاعي وساطة البيانات والتحليلات ا مصاحبة لها. حيث يمكن لوسطاء البيانات. من خلال 
الجمع بين مخازن كبيرة من البيانات الصغيرة التي تحتفظ بها المؤسسات العامة والشركات 
الخاصة ودمجها جنبا إلى جنب مع مجالات تدفق البيانات الكبيرة: إنتاج مختلف أنواع 
الملفات التعريفية التفصيلية للأفراد والمجموعات والتى يمكن استخدامها للاستهداف المركز 
للأسواقء» وتقسمهاء وفرزهاء مما يوفر معلومات ذات قيمة عالية للعملاء. كما تكشف هذه 
الممارسات عن بعض القضايا وا مخاطر الناجمة عن التوسع في نطاق البيانات» وبالتحديد 
استخدامها لغير الأغراض التى جمعت لأجلهاء وأمنهاء والفرص الجنائية في حال تم سرقة 
البيانات. حيث م TR‏ أي من هذه القضايا وا مخاطر بشكل تام حتى الان.» ga‏ ضعف 
الجانب التنظيمي والإجراءات المضادة. 

فهناك العشرات من:الأسئلة التي تتطلب اهتماما بشأن الدور المستقبلي وطبيعة 
دراسات البيانات الصغيرة» وتوسيع نطاق البيانات الصغيرة إلى أشكال مختلفة من البنى 
التحتبة للبيانات والآثار المترتبة عليهاء والعواقب الناتجة عن حفظ البيانات والوساطة 
فيها على أساس الربح. ومع ذلك» فمن الواضح أن التحليل النقدي للتغيرات التي تحدث 
ليست مواكبة للتطورات التقنية والتجارية» فالواقع أنه حتى الآن كان هناك عدد قليل من 
الانطباعات النقدية المبنية على أساس التفكير من خلال الآليات والدلالات ف كيفية إنتاج 
البيانات الصغيرة. وتوسيع نطاقها واستخدامهاء والتنظير لأدواتها - قواعد البيانات والبنى 
التحتية للبيانات - التي يتم استخدامها لتنظيم وتبادل وتحليل البيانات. UI doug‏ 
هناك ندرة في المعرفة المتعلقة بالأنظمة الاجتماعية التقنية الناشئة وال معقدة التى يتم 
إنشاؤهاء مع عدد قليل من دراسات الحالة المعمقة. ومن ثمء يتضح أن هناك حاجة للكثير 
من البحث والتأمل لفهم البنى التحتية للبيانات في جميع أشكالها. 
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الفصل الثالث 
السانات المفتوحة Data)‏ 6م07) والسانات المرتبطة (Linked Data)‏ 


بالنظر إلى التكاليف والنفقات والموارد ال مطلوبة لإنتاج مجموعات البيانات وقيمتها في 
الكشف عن معلومات عن العام من حولناء فقد تم بشكل عام تقييد الوصول إليها بطريقة 
أو بأخرىء» فعلى سبيل ال مال يتاح الوصول للمستخدمين ا المعتمدين فقط, أو من 
خلال المطالبة برسوم اشتراك» أو عن طريق حصر الكيفية التي يمكن فيها استخدام البيانات 
بواسطة السياسات والتراخيص. وحتى عندما كانت مجموعات البيانات متاحة ومفتوحة 
2 فقد كانت تتطلب معدات وأدوات متخصصة لفهمها والوصول إلبهاء مثل أجهزة 
الحاسب.ء والبرمجيات» واطهارات المتعلقة بطرق الإحصاء ورسم الخرائط والمعرفة السياقية 
للحقل أو الموضوع الذي يجري التطرق إليهء مما يتعذى بكثير قدرات عموم الناس. ونتيجة 
ذلك ف كانت السانات وا ما Lata Baar aco]‏ تقليجا تغلقة إل E S ar‏ 
مقفل عليها داخل مؤسسة أو محفوظ أرشيفي. وفى الواقع» فقد مثل عدم إتاحة الوصول 
إلى مجموعات البيانات التي يمكن أن تساعد في الإجابة.عن أسئلة معينة مصدر إحباط على 
مدى قرون للباحثينء والمحللين. والصحفيين. ومنظمات ال مجتمع المدنى. 

هومن هذا المنطلق سعت حركة البيانات المفتوحة لتحويل هذا الوضع جذريًا ليس 
فقط من خلال فتح البيانات وإتاحتها لإعادة استخدامها على نطاق أوسع فقطء ولكن أيضا 
من خلال توفير أدوات بحثية سهلة الاستخدام والتي لا تتطلب الحاجة إلى مهارات تحليلية 
متخصصة. وبنيت هذه الحركة على ثلاثة مبادئ هي: الانفتاح» والمشاركة: والتعاون 
(البيت الأبيض 2009 10# مط W)؛‏ فمن خلال الشفافةء «aS Lillo‏ والعمل معا ممكن 
إدراك قيمة البيانات للمجتمع. وتهدف الحركة إلى تحرير القدرة على إنتاج المعلومات 
«AS s elo‏ بدلا من حصر إمكانية الاستفادة من قوة البيانات e‏ منتجيها أو أولتك الذين 
يممكنهم دفع تمن إتاحة الوصول إلى البيانات. وقد تركز الاهتمام» على وجه الخصوص» على 
فتح البيانات التي G3‏ إنتاجها من قبل أجهزة الدولة وغالبا ما يطلق عليها معلومات القطاع 
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الفصل الثالث 


العام əl (Public Sector Information - PSI)‏ البحوث الممولة من القطاع العام (انظر 
الفصل الثاني). مع الأخذ بالحسبان بأن هذه البحوث قد تم تمويلها من قبل الخزينة العامة 
لفائدة عامة الناسء مع تركيز أقل على فتح البيانات التى تم إنشاؤها من قبل القطاع 
الخاص» والتي قد يكون لديها قيمة خاصة أكبر عند منتجيها على وجه الخصوص. 

وقد تطورت حركة البيانات المفتوحة خلال العقدين اماضيينء بالتزامن مع - ولكن مع 
فصل واضح إلى حد كبير عن - حركة الحق ق ال معلومات (Right to Information-RTI)‏ 
المعنية باتخاذ قرارات الشفافية وصنع السياسات من قبل الوكالات وا معروفة أيضا باسم 
حرية المعلومات (Freedom of Information)‏ وحركتى المصدر المفتوح والعلوم ال مفتوحة 
المعنيتين بإعادة تشكيل البرمجيات والنشر إلى أشكال مفتوحة وشفافة فيما يتعلق بالترخيص: 
وحقوق الطبع والنشر» وحقوق الملكية الفكرية. فمنذ اواخر سنة 2000م, اكتسبت حركة 
البيانات المفتوكلة,مكانة بازّزة وزخم ثابت بشكل ملشؤظ: ابتداةةاقن حملة صحيفة 
الغارديان في المملكة المتحدة تحت مسمى" تخل٫ىص‏ lilııتنl- Free Our Data" (WWW.‏ 
60111/]611110108[/1166-01128. 9 ودعوة منظمة التعاون الاقتصادي 
(Organization for Economic Cooperation and Development - OECD) duilo‏ 
حكومات الدول الأعضاء لفتح بياناتها في عام 2008 م: وإطلاق الحكومة الأمريكية في العام 
9 للموقع الإلكتروني d(www.data.gov)‏ وهو موقع على شبكة الإنترنت صَمّم لتوفير 
الوصول إلى مجموعات البيانات غير الحساسة والتاريخية التي تحتفظ بها أجهزة الدولة 
على مستوى الولايات ومستوى الحكومة الفيدرالية بالولايات المتحدة الأمريكية, وتطوير 
البيانات ال مرتبطة والترويج ل الويب الدلالىي pass (Semantic Web)‏ موحد لتكنولوجيا 
الانترنت في المستقبلء والذى ممكن البيانات ال مفتوحة والبيانات المرتبطة من أن تتصل في 
الغالب بشكل طردي (2009 86111615-1.66). ومنذ عام 2010 م» حذت حذوها عشرات 
الدول والممنظمات الدولىه على «JUI Ls‏ دول الاتحاد الأوروي European Union-)‏ 
لاظظ)ء وبرنامج الأمم 822 United Nations Development Programme-) ,3LLéVl‏ 
0111(8]) مما جعل الآلاف من مجموعات اليياناث اللقيدة سابقا متاحة ومقتوحة بطبيعتها 
للاستخدام غير التجاري والتجاري (انظر 2013 1026316721<60). وقد أسهم في مثل هذا 
التحول ف الموقف مجموعات الضغط الدولية والوطنية المؤثرة مثل مؤسسة ال معرفة المفتوحة 


i ce GE. -r M M T 


AA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام ‏ 8819| الزنع 9© 


السيانات المفتوحة والسانات ال مرتبطة 


(10111101261010 11101116056 02612)) ومؤسسة ضوء الشمس (1011110126101 51112119[6)؛ 
ورافقه ضغط من المجموعات والشركات العاملة في مجال الاقتصاد امعرفء بالإضافة إلى 
كبار موظفي الخدمة امدنية المقتنعين بالحجج ال مستخدمة: وعشرات الجماعات امحلية التى 
تسعى للاستفادة من السانات اطدنية. 

وق حين يتم عرض حجج حركة البيانات المفتوحة بطريقة بديهية. باستخدام مفردات 
الاستعارة البلاغية مثل الشفافية: «AS JL la «deba‏ والابتكار, والنمو الاقتصاديء فإن 
الانفتاح السريع للبيانات الحكومية والعلمية م يلق Le Lj‏ فالواقع, أن العديد 
من الاثار الاجتماعية والسياسية والاقتصادية لفتح البيانات يجري حاليا الكشف عنها 
ومناقشتها وانتقادها. وعلاوة على ذلكء وللمفارقة إلى حد ماء تعزز نطاق ومدة حقوق 
الملكية الفكرية على مدى نصف القرن الماضيء بمعنى أن نمو خركة البيانات المفتوحة تم 
بالتوازي مع زيادة في حقوق الملكية الفكرية (2006 عاء20110). فامقاومة التي واجهتها 
فكرة توفير حرية الوضول إل البيانات العلمية نوقشت في الفضل السابق» وسيتم في القسم 
الأخير من هذا الفصل مناقشة الانتقادات الموجهة لدعوى البيانات ال مفتوحة. فبداية» ومع 
ذلكء يحدد هذا الفصل خصائص السانات الممفتوحة والسانات ال مربطة. ومختلف الطرق 
التى ola‏ لقضية السانات ال مفتوحة: والاقتصاديات ا مرتبطة بتقديم بيانات مفتوحه. ves‏ 
الرغم من أن فتح البيانات الحكومية ما يزال Lye‏ فليس هنالك شك في أن lu ygs‏ 
يحدث بشأن الكيفية التي تتم من خلالها عرض ومشاركة البيانات بشكل عاة. 


البيانات المفتوحة (10262 :)Open‏ 

Aso «Db sz ll ael axe‏ تعريف مصطلح البيانات ا لمفتوحة بسيط dsl‏ فقد حدده 
بولوك )2006( على سبيل امثال كالتالي: «تكون البيانات مفتوحة إذا كان لأي شخص الحرية 
RS à‏ وإعادة استخدامهاء وإعادة نشرها - فقط شرط موافقتها لمتطلب إسنادها 
/ أو مشاركتها غلى حَدَ سؤاء».: ولكن هذا التعريف يلمّح إلى الطبيعة المتنوعة ما يمكن 
أن يكون عليه المقصود من لفظة «الفتح» وكيف أنها يمكن أن تعني أشياء مختلفة بالنسبة 
مختلف الوكالات في سياق حقوق الملكية الفكرية. فقد يشير الانفتاح إلى الاستخدام 
أو إعادة الاستخدام» أو إعادة الصياغة» أو إعادة التوزيع» أو إعادة النشر والتوزيع أو 
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إعادة البيعء وقد يكون لكل منها شروط وأحكام تختص بهاء فعلى سبيل المثال قد يكون 
للمستخدم القدرة على استخدام مجموعة البيانات بحرية مموجب ترخيصء ولكن ذلك لا 
يعني إمكانية إعادة التعامل مع هذه البيانات بهدف الربح التجاري أو إعادة البيع» أو 
أي استخدام قد يتطلب الإسناد. وبعبارة أخرىء. قد يكون الوصول إلى مجموعة البيانات 
مفتوحاء ولكن ليس بالضرورة أن يكون كل ما يمكن فعله مع البيانات ا ممكن الوصول إليها 
مفتوح ba‏ 35 حالات أخرى؛ قد تحتفظ المنظمات ببياناتها وتتحكم بإتاحة الوصول 
إليها بنفسهاء ولكنها تتيح بحرية البيانات الوصفية المتعلقة بها فقطء أو قد تسمح المنظمة 
لبعض ال مستخدمين بالوصول إلى البيانات: ولكنها لا تمكنهم من إعادة نشرها إلا إذا كان ذلك 
سيحقق قيمة مضافة لها وبدون الوصول إلى البيانات الأولية الأساسية. 

ومع ذلك. سعت عدد من المنظمات الى تحديد الخصائص امثالية للسانات المفتوحة؛ 
على سبيل.المثال يؤكد تعريّف الانفتاح بأن العمل هو مفتوخ إذا استوفت حالته في النشر 
الشروط المنصوص عليها في الجدول رقم (Y-V)‏ والتي تفرض بعض القيود على الوصول. 
والاستخدام. وإعادة الصياغة: وإعادة التوزيع والنشرء وتشجع كذلك بشكل نشط على 
الاستخدام الربحي للبيانات ال مفتوحة دون آي تعويض مالي ممنشن البيانات الأصلي. وباممثلء 
حددت منظمة الحوكمة المفتوحة OLLU golo äz—5 (OpenGovData)‏ المفتوحة 
تتعدى مجرد نمط التوزيع إلى النظر أيضا في طبيعة البيانات نفسها (انظر الجدول رقم 
3-2). وبالإضافة إلى هاتين المجموعتين من الشروط / اسادئ. اقترحت وكالات أخرى مثل 
منظمه التعاون الاقتصادى والتنمية (2008) ((2018:01) والحكومة الأسترالية (117661210 
0) حاجة البيانات المفتوحة إلى أن تكون مصحوبة بقوائم الأصول وآليات اكتشاف 
البيانات» من أجل إصدار المؤشرات المتعلقة بجودة البيانات وموثوقيتهاء واستخدام النماذج 
والمعايير التي تتيح قابلية التشغيل البيني للبيانات المفتوحة» وتوفير بنى تحتية سهلة 
الاستخدام للبيانات لتسهيل النشر المنتظم وإيجاد مجموعات بيانات جديدة: بالإضافة 
إلى عدد من الأدوات الأساسية والتخصصية التي من شأنها أن تحسن الاستخدام والتحليل 
للبيانات. ويعد ضمان التشغيل البيني مهما بشكل خاص لأنه يسمح بربط مجموعات 
البيانات المختلفة: مما يُسهم فى بناء مجموعات بيانات جديدة أكثر تعقيدا واكتشاف رؤى 
جديدة dò shl duwga)‏ الطفتوحة 2012 A79 Y LS .(Open Knowledge Foundation‏ 
قيود فيما يتعلق بمجالات التركيز للبيانات المفتوحة - حيث يمكن أن تتعلق بأي مجال 
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«ace Ux V! NU A ous‏ والاقتصادبية: والتجارية: والثقافية (وسائل الإعلام وامكتىات 
والتراث)ء والبيئية» أو الظواهر العلمية - «3SJ9‏ بشكل عام: ينصب التركيز حتى الآن على 
فتح البيانات التي تتصل بالسياسات العامة عالية ال مستوى ولها قيمة تجاريه عند إعادة 
استخدام مثل البيانات المتعلقة بالاقتصادء والنقل. والبيانات الجغرافية. 
جدول رقم (Y-Y)‏ 
الخصائص المثالية للبيانات المفتوحة المتعلقة بتعريف الانفتاح 
إتاحة Access Jgog)l‏ ينبغي أن يكون العمل متاحا ممجموعه ككل وبلا تكلفة إعادة 


إنتاج تتجاوز ال معقول كما ينبغي أن تتوفر بشكل مناسب LG‏ 
للتعديل 


إعادة التوزيع ينبغي أن لا تقيّد الرخصة أي طرف عن بيع العمل أو 
Redistribution‏ توزيعه سواء فيما يتعلق بالعمل نفسه أو كان ذلك العمل 
كجزء من حزمة ix‏ من أعمال من عدة مصادر مختلفة. 

وينبغي أن لا يتطلب الترخيص إتاوة أو رسوماً أخرى لهذا 


البيع أو التوزيع. 


إعادة VI Reuse elaz-z4y!‏ يسمح الترخيص بالتعديل على العمل وإجراء عمليات 


الاشتقاق منه ويسمح كذلك بتوزيع الأعمال المشتقة 55[ لآحكام 
العمل الأصلى. 


غياب القيود duil‏ ع©ع4562. | ينبغى تقديم العمل على الصورة التى لا يوجد معها عقبات 
of technological restrictions‏ | تقنىة تحول دون استخدامه أو إعادة توزرعه. 


الإسناد Attribution‏ قد يلزم الترخيص الإسناد إلى المساهمين وال مبدعين للعمل 
الأصلي كشرط لإعادة التوزيع وإعادة الاستخدام» وإذا تم فرض 
هذا الشرط فينبغي ألا تتطلب عملية الإسناد إجراءات مرهقة 
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من OS sl‏ أن JB o‏ الترخيص حمل الإصدارات المعدلة للسانات 


أسماء تختلف عن العمل الأصلي كشرط لإعادة توزيعها. 


ينبغي عدم تمييز الترخيص ضد أي شخص أو مجموعة من 
الأشخاص وضمان إتاحة الوصول للجميع. 


SUD‏ عدم تقد أي شخص من الاستفادة من العمل à‏ أي مجال 
ER‏ على سبيل ال مثالء لا ينبغي تقييد العمل من استخدامه في 
الأعمال التجارية. 


ينبغي تطبيق الحقوق المتعلقة بالعمل على جميع الذين يتم 
إعادة توزيعه عليهم دون الحاجة لتنفيذ ترخيص إضافي من قبل 
تلك الأطراف. 


ينبغي أن لا تعتمد الحقوق المتعلقة بالعمل على كونه جزءا من 


ينبغي أن لا يضع الترخيص قيودا على الأعمال الأخرى التي يتم 
id] Gir Lago 3s!‏ عن هع لحيل قوفص کی سق اال 
ينبغي أن لا يضر الترخيص على أن تكون كل الأعمال المستمدة 
مثة مفتوحة Viol‏ 


JUI Lail 


الصحه والنزاهةه Integrity‏ 


عدم التمييز ضد الأشخاص أو 
امجموعات 
No discrimination against‏ 


persons or groups 


عدم التمييز ضد مجالات معينة 
في No discrimination Jesl‏ 


against fields of endeavor 


Distribution ja» jJ! 2:55 
of licence 


عدم تعيين الترخيص على حزمة 
Licence must not be JL!‏ 


specific to a package 


عدم تقييد الترخيص توزيع 
الأعمال الأخرى ائmu Licence‏ 


not restrict the distribution 


of other works 





.http://opendefinition.org/od ¿ye uiio : jabl 
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السيانات المفتوحة والسانات المرتبطة 


جدول رقم (Y-Y)‏ 
مىادئ منظمة الحوكمة المفتوحة للسانات الممفتوحة 


"LY <å >‏ | 5 چ 
Data must be complete‏ الخصوصيه» والامن او قيود الصلاحيات 









يجب أن تكون البيانات أساسية (أولية) أ تنشر البيانات كما تم جمعها من المصدرء مع أفضل 
مستوى ممكن من التفاصيل» وليست بأشكال مجملة أو 


معدلة. 












Data must be primary 





إتاحة البيانات في أسرع وقت ممكن عند الحاجة لها 
للحفاظ على قيمه السبانات. 





Data must be timely 
يجب أن تكون البيانات في المتناول | إتاحة البيانات لأكبر عدد ممكن من المستخدمين ولأوسع‎ 













Data must be accessible 










يجب أن تكون البيانات قابلة للمعالجة | تنظم البيانات بشكل مناسب للسماح با معالجة الآلية لها 
الآلة 


Data must be machine- 


processable 


يجب عدم تمييز عملية الوصول تتوفر البيانات لأي أحدء. مع عدم اشتراط التسجيل. 
Access must be non-‏ 


discriminatory 


يجب أن تكون صيغ البيانات غير | تتوفر البيانات في صيغة لا يكون فيها سيطرة حصرية 


Data formats must be non- 


proprietary 
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الفصل الثالث 


يجب أن يكون ترخيص البيانات مجانيا أ لا تخضع البيانات لأية أحكام في حقوق التأليف والنشر 

وبراءات الاختراع والعلامات التجارية. وقد يُسمح ببعض 

قيود الخصوصية والأمن والصلاحيات المناسبة بحسب ما 
تفرضه التشريعات الأخرى. 


Data must be licence-free 


يجب أن يكون الامتثال قابلا للمراجعة | يجب أن يتم تعبين شخص كضابظ اتصال للرة على الناس 
وإعادة النظر الذين يحاولون استخدام البيانات أو تقديم شكاوى حول 
انتهاكات ال مبادىئْ الرئيسية. ويجب أن يكون هناك iua‏ 
أخرى ذات اختصاص لتحديد ما إذا تم تطبيق المبادئ 
بشكل aen‏ 


Compliance must be reviewable 





امصدر: مقتبس من http://www.opengovdata.org‏ 

وإلى جد كبير. تعد هذاة الخصائص المثالية البيانات المفتوحة مُنتجاء وليست,خدمة. وفي 
اطمقابلء فقد حادل (2013) 3111566111) حول الحاجة إلى إعادة التفكير بالبيانات المفتوحة 
كعملية خدمية (77106655 5611:166)- بوصفها تفاعلا وتنطوي على علاقة بين مزودي البيانات 
وا مستخده النهائي. فبالنسبة له لا يكفي أن تكون البيانات ببساطة متاحة من قبل ال منظمات 
لإعادة استخدامهاء بل ينبغي أن يكون فتح البيانات موجّها أكثر باعتباره خدمة. مع الأخذ بعين 
الاعتبار حاجات وتوقعات المستخدمين النهائيين منهاء فهذه الإعادة لصياغة المفاهيم تقترح 
على أولئك الذين ينتجون البيانات المفتوحة اتباع طرقا مختلفة لإدارة البيانات والمستخدمين 
النهائيين. كالآثار المترتبة على قضايا إعادة تحديد المصدر الخاص بالبيانات. فبالئسية له 
يتطلب هذا النوع من النهج مشاركة ا مستخدمين النهائيين في التخطيطء والتطويرء وإدارة 
المشاريع الجارية للبيانات المفتوحة. وكذلك استخدام مقاييس لتقييم مدى نجاح مثل هذه 
المشاريع في تعزيز الصالح العام. وهذا يتطلب برامج بناء القدرات الرامية إلى رفع مهارات 
المستخدمين ليكونوا قادرين على إدارة ومعالجة وتحليل البيانات بشكل مناسب وفعال. 
ورغم أنه من السهل أن نتفق على أنه ينبغى تسليم البيانات ا مفتوحة كخدمة: إلا أن 
البيانات المفتوحة بطبيعتها لا تنتج دخلا أو تنتج القليل مقابل تمويل هذه الترتيبات الخدمية 
فضلا عن التكاليف المتعلقة بفتح البيانات فالواقع أن ذلك قد يكون من الطموح إلا إذا تم 
تطوير نماذج تمويل فعالة (كما نوقش أكثر بالكامل أدناه). 
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السيانات المفتوحة والسانات ال مرتبطة 


السانات المرتبطة :(Linked Data)‏ 
تتمثل فكرة البيانات المرتبطة بتحويل شبكة الانترنت من شبكة الوثائق إلى شبكة البيانات 
من خلال إنشاء الشركة الدلالية (2010 (Semantic web) (Berners-Lee 2009; P. Miller,‏ 
أو ما اصطلح عليه 2010) 13,56 4صة 60042:4) بمصطلح «المقروءة آليا على شبكة الإنترنت» 
.)Machine-Readable Web)‏ وتدرك هذه النظرة بأن كافة المعلومات التي يتم تبادلها 
على الإنترنت تحتوي على تنوع غني للبيانات - أسماءء وعناوين: وتفاصيل طمنتج» والحقائق: 
والأرقام Jl‏ اخره. ومع ذلك» لا يتم بالضرورة تحديد هذه البيانات bd]‏ على gal lis‏ 
كما أنها ليست منتظمة رسميا في طريقة يمكن معها جمعها واستخدامها بسهولة. فالواقع: أن 
معظم وثائق شبكة الإنترنت غير منظمة إلى حدّ كبير في طبيعتها. ومن خلال ترميز الوثائق 
وهيكلتها باستخدام معرفات فريدة واستخدام لغة التوصيف «(Markup Language)‏ مكن 
جعل البيانات التي تحتويها هذه الوثائق مرئيةء وتمكين الاخرين تلقائا من دمجهاء ومعالجتهاء 

وفهمهاء وربطها مع السانات الأخرى ذات الصلة (2010 :1/1116 2). 

ومن أجل تمكين شركة الانتزرنت الدلالية ol e‏ تعمل كبيانات مرتبطة؛ بین Berners-‏ 
(2009) 1.66 حاجة الوثائق ال منشورة على شبكة الإنترنت للمواءمة مع أربعة توقعات 
سلوكية. Yol‏ يجب تعريف الكائنات وامطوارد ضمن كل وثيقة باستخدام لغة التوصيف 
امموسعة Extensible Markup Language)‏ -.2111) وتسميتها بشكل واضح لا لبس فيه 
L6 (Uniform Resource Identifiers -URIs) 821—231! 35155] 585 elus sb‏ 
ينبغي استخدام الهيكل الضمني لشبكة الإنترنت لربط الوثائق والمعلومات (على سبيل 
«JULI‏ استخدام معيار نقل النصوص التشعبية - أتش تي تي بي (111"17) ومعرفات الموارد 
uoo (URISs) $42 5‏ ممكن التنقيب في الأسماء والبحث فيها). La au Jt‏ اكتشاف 
المعلومات حول كائن مسمّى أو مورد (على سبيل المثال» عندما يقوم شخص بالبحث عن 
معرّف لكائن ماء تقدّم له معلومات مفيدة باستخدام معايير إطار عمل وصف الموارد 
.)Resource Description Framework -RDF)‏ فإاطار عمل وصف الموارد هو 59 &4 
تفصّل وتصف طبيعة معرّفات الموارد ضمن نطاق ما وينبغي أن يحال كل معرّف إلى 
هذه الوققة لتحصيل (Goddard and Byrne 2010) EN‏ ويضمن استخدام 
هذه ال معايير إطارا مشتر شتركا لجمع البيانات عبر الإنترنت» بدلا من اعتماد مجموعة كبيرة من 
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JUI Laii 


الأسالي المتعارضة )2012 df; (Dietrich‏ توفير وصلات للربط بين الكائنات والموارد 
ذات الصلة: ]15 كانت معروفة؛: بحيث مكن للمستخدمين اكتشاف المزيد من الأشياء. 

وتمكن هذه التوقعات السلوكية من جعل الوثائق مقروءة آليا ويمكن معالجتها بحيث 
يكون التعرف على طبيعة الكائنات فيها ممكنا (على سبيل JE‏ الولايات المتحدة هي بلد. 
وباراك أوباما هو شخص)» وإزالة الغموض عن المفاهيم (على سبيل ال مثال» مارس هو قطعة 
شوكولاتة» والمريخ (مارس) هو كوكب؛ أو أن باراك أوباما هو مؤلف وثيقة مقابل أن باراك 
أؤباما هو موضوع وثيقة). وإنشاء روابط وعلاقات داخل البيانات (على سبيل المثالء باراك 
أوباما هو رئيس الولابات المتحدة( )2010 (Goddard and Byrne‏ وبهذه الطريقة؛ 
يصبح من الممكن لوثائق ى شبكة الإنترنت أن تكون قابلة للقراءة الث نه ا ق das.‏ 
برنامج القراءة على فهم ا محتوى ولكن ممكنه أن يستمد Lao]‏ بيانات مشتقة جديدة من 
خلال الاستدلال من ال محتوى )2010 .(Goddard and Byrne‏ 


Sce cds eI as (369). 43 loazeg‏ ا“شتخلاض' العلوانات على شيكة الإنترنت 
وإعادة تقدهها كبيانات وربظها بطرق لا حصر لها اعتمادا على الغرض. ولكن» وبحسب 
ما دون (2010) 24111161 ,2 فإن «السانات ا مرتبطة مكن أن تكون Ollo‏ مفتوحة. ويمكن 
رنظ اليباتات اللفموحةوولكن شعن الممكن أرضةالسافات اللرتظ ةربن تحمل J tash‏ 
غيرها من القيود التى تحول دون اعتتارها مفتوحة»»: أو إتاحة السانات المفتوحة بطرق قد 
لا تجعل من السهل ربط بعضها ببعض. وبشكل ele‏ فإن أي وثائق مرتبطة ليست متوافرة 
على شبكة الإنترنت أو تقع ضمن نطاق نظام اذ شتراك مدفوع هى أيضا بيانات مفتوحة 
بطبيعتها. فبحسب ما یری (2009) 8۲۸٥۲-1٥۲‏ ینبغی أن تكون السيانات المفتوحة 
والبيانات المرتبطة متكافئة بشكل مثالي: وإضافة لذلك فقد حدد خمسة مستويات لمثل 
هذه البيانات» كل منها أكثر فائدة وقيمة تدريجيا (انظر الجدول رقم 3-3). وكان تطلعه 
إلى ما أسماه بيانات الخمسة نجوم (المستوى الخامس) - شبكة دلالية عاملة بالكامل. 
ولق تجدر الأقارة إل أنه بالنسة إل الفدين من «col Bac‏ ف إن محرة الحصول Je‏ 
مستويات أعلى من المستوى الأول يُعنَ إنجازاء وكون المستوى الخامس بعيد المنال عنها دون 
عمالة ماهرة. وموارد إضافية: وآأدوات جديدة. 
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البيانات المفتوحة والبيانات المرتبطة 


(Y-Y) JaJa 


المستويات الخمسة للسانات ال لمفتوحة والسانات المرتبطة 


يتم قفل البيانات في 
الوتيقه ويصعب تحريرها 


لاحقا. 
هكن تحليل البيانات | تعتمد على برامج حصرية 
للوصول إليها واستخدامها. 
td JS VI /‏ كما يمكن 


تصديرها إلى صيغ أخرى. 





ممكن تحليل البيانات هل البيانات على «AS JI‏ 
باستخدام أية حزمة ليست البيانات على 
الشبكة» وليست مرتبطة 
بطبيعتهاء ومن ثم هي 
معزولة. 
يمكن الوصول إلى البيانات | يمكن أن تزيد زمن تحضير 
من أي مكان على شبكة. | البيانات وإدارة البيانات 
الإنترنت» ومن السهل ربطها وتبادلها. 
جنبا إلى جنب مع غيرها من 
البيانات» وإمكانية وصلها 





بالأدوات والممكتئات القائمة. 
ولكن تصبح البيانات أكثر 
اكتشافا وتمنح المستخدمين 








للحفاظ على الروابط 
الداخلة والخارحة. 


وضلا كاملا الى مخطط 
(أنطولوجيا) البيانات 


باستخدام البرمجيات الحصرية 









e)‏ سبيل اممثال» صيغة سي 








مقروءة آلياً ولكن بصيغة 
JULI Jw dle) d pao‏ 
فلك ادل 


مقروءة Ui‏ باستخدام صيع 
عامة غير حصرية 





(CSV -$ o 


مقروءة Ui‏ باستخدام صيغ 
عامة غير حصرية واستخدام 
امعرفات ووصف الموارد 
(URIs and RDF)‏ 


مقروءة Ui‏ باستخدام صيغ 

عامة غير حصرية واستخدام 
اطمعرفات ووصف اموارد 

ومرتبطة بالبيانات والبيانات 


الوصفية الأخرى 


. Michael Hausenblas às: http://sstardata.inio المصدر: معدلة عن‎ 
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الدعوّى نحو السانات المفتوحة: 
في حين كان لدى بعض البلدان» مثل الولايات المتحدة. تقليد عريق في جعل بعض 
بيانات القطاع العام متاحة بحرية. وخاصة البيانات ذات الفائدة العالية مثل بيانات 
التعدادء ورسم الخرائطء والطقس» فإن إتاحة الوصولء في بعض البلدان الأخرىء يتم بشكل 
عام من خلال نموذج تغطية التكاليف الذي يتيح البيانات بمقابل مالي وبموجب اتفاقية 
ترخيص معتمدة. ففي اللمملكة المتحدة: تخضع الوثائق الحكومية لحقوق التأليف والنشر 
املكية (71181إم0) 2101711)) وتحكم البيانات ذات الفائدة العالية بواسطة الصناديق 
التجارية (على سبيل «JU‏ بيانات الخرائط ضمن هيئة المسح الجغرافية» وبيانات أحوال 
الطقس في مكتب الأرصاد الجوية) التي تعمل بصفة كيانات احتكارية» وتتحكم في الوصول 
إلى مجموعات سانات ;4.5 )2006 (Arthur and Cross 2006; Pollock‏ . وعلى مدى 
العقدين الماضيينء تم تجميع مجموعة من الحجج لبناء دعوى إعادة صياغة دور هذه 
الصناديق وفتح بيانات القطاع العام للجمهور. وبصفة عامة» هكن تقسيم هذه الحجج 
والاستحقاقات في خمسة أشكال. والتي ينظر إليها على أنها ذات فائدة لكل من حامل 
البيانات والمستخدم النهالى. 
أولا: حيث أن الكثير من :البيانات"في إطار.الهيئات:العامة والمنظمات,غير الحكوميّة تتعلق 
بالعمليات التشغيلية لتلك الهيئات» فهي توفر وسيلة يمكن من خلالها قياس مدى 
نجاح مختلف البرامج والأنشطة الخاصة بها. ولذا فإن فتح هذه البيانات للتدقيق 
والرقابة العامة سيجعل أعمال المنظمة وصنع القرار فيها تتمتع بالشفافية ويمكن 
استخدامه لتعزيز المساءلة وتقييم القيمة الناتجة مقابل امال ا مستثمر (21155611[ 
Gordon 2013‏ ;2012( 489 تزايدت أهمية هذه الشفافية وال مساءلة في الخطاب 
العام في عصر سياسات التقشف ومحدودية الموارد. وفي سياق ال مناقشات الجارية 
حول اممشتريات» والهدرء والعجز الظاهر ف الخدمات العامة. 
تانيا: يسمح إتاحه الوصول للمستخدمين النهائيين لبيانات اممنظمه» على زعم البعض» 
برفع مستوى الوعي حيال القضايا المثارة» مما يسهل الاختيار وصنع القرار فيما 
يتعلق بالخدمات العامة. ويشجع على المشاركة الفاعلة والواعية في المجال العام 
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Yiu 2012)‏ :2012 1ع21155[). وعلاوة على ذلكء. فإن إتاحة الوصول للمستخدمين 
النهائيين لسانات المنظمة يعزز امواطنة الفاعلة والمشاركة السياسية في تشكيل 
كيفية أداء وتنظيم الحكم المحلي )2011 .(Huijboom and Van der Broek‏ 
«odas‏ بدورهاء تشجّع الابتكار الاجتماعي: وتعمل على تعزيز العلاقات بين أفراد 
المجتمع» ورفع مستوى النقاش العام (2012 ناذلا): ونتيجة لذلكء تمكن البيانات 
امفتوحة من بناء الدموقراطية القائمة على المشاركة. 


: يشجع فتح البيانات حول المنظمة وأدائها على استخدامها هذه البيانات للاستفادة 


à‏ تحسين الكفاءة التشغيلية والإنتاجية من خلال اطراقبة واتخاذ القرارات بالأدلة 
والبّنات المشتة. وعلاوة على ذلكء: تحصل وحدات الأعمال داخل المؤسسة على 
حق الوصول إلى البيانات وإمكانية استخدامها عبر المنظمة بكاملهاء مما يؤدي إلى 
رؤى ومعارف جديدة ومزيد من التفكير المشترك والكفاءة );2012 Northcutt‏ 
.(Verwayen et al. 2011‏ وإضافة لذلكء فإنه مكنهم اكتساب ملاحظات وردود 
قيّمة وتلقي النصح والمشورة من الوكالات الخارجية التي تقوم باستخدامهاء وتحليلهاء 
وتفسيرهاء مما يرفع من مستوى الجودة. والنزاهة. والفائدة من البيانات. وتؤدي 
هذه التحليلات الداخلية والخارجية إلى تعزيز الحوكمة التنظيمية وإدارة امجتمع 
على نطاق أوسع.: على سبيل المثال التصدي للغش والتزوير والجرائم الأخرى من 
خلال إنشاء خدمات أكثر ullgة‏ )2011 lS .(Huijboom and Van der Broek‏ 
أنها تمكن من الرصد والتقييم المستمرين لأثر السياسات والبرامج الجديدة (مؤسسة 
امعرفة اطمفتوحة 2012 (Open Knowledge Foundation‏ 


رابعا: يمكن توفير البيانات المفتوحة من إثراء العلامة المميزة» فإتاحة البيانات بحرية يرفع 


من شأن ال منظمة» ويدلل على ريادتهاء وروح المبادرة فيهاء ويخدم مهمتها العامة 
ويزيد مستوى الاتصال والتفاعل مع العملاءء والملستخدمين النهائيين ويقود التوجه 
إلى الخدمات S9 (Verwayen etal. 2011) 4 ssl‏ المقابلء يبني هذا الثقه 
والسمعة. ويعمل على تكوين انطباع عن اطعايير الفاضلة للمؤسسة. 
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خامسا: بينما تمتلك بعض مجموعات البيانات المنشئة والقائمة في العلن قيمة اقتصادية هامشية, 
على سبيل ال مال تلك المتعلقة بالتراث الثقا» فإن الكثير من مجموعات البيانات الأخرى 
لديها قيمة تجارية كبيرة. ويمكن استخداه البيانات التى تم إنشاؤها علنا لإضافة قيمة 
إلى البيانات التجارية القاثمهء وإنشاء تطبيقات وخدمات جديدة ومن ثم أسواقا JA‏ 
وتحسين المعرفة واتخاذ .(Janssen 2012; Yiu 2012) JUeXJ Ohh‏ ولذا فليس من 
امستغرب عندئذ حرص المصالح الصناعية على الدعوة لفتح البيانات ال منتجة علنا لإعادة 
استخدامها في القطاع التجاريء وخاصة البيانات التي طاما غرفت باحتوائها وإمكانية 
إنشائها لقيمة كتلك التي تدار من قبل صناديق تداول القطاع العام (على سبيل ال مثالء 
بيانات الخرائط). فهناك من يزعم ob‏ 55 تقييد الوصول إلى البيانات العامة: والتي تم إنشاؤها 
من أجل المصلحة العامةء يخنق dawg Je zy‏ على فقدان وزن ممست للاقتصاد؛ أي أن 
حصر استخدامها فقط ممن لهم القدرة على تحمل تكلفتهاء هو تسعير لإخراج الآخرين من 
السوق )2012 (Pollock 2006; Yiu‏ ولذا فإن الاستثمار العام في إنتاج البيانات مم يستغل 
بالشكل المناسب كما تم فقدان العديد من الفرص التي من شأنها أن تضفي قيمة على 
نشاطات القطاع الخاص (2012 1اذلا). وإضافة إلى ذلك؛ فقد تأثير الارتفاع على الاقتصاد 
الشامل نتيجة فقدان القيمة الناتجة عن فتح البيانات العامة (2012 (Northcutt‏ 


وتتفاوت كيفية احتساب أوزان هذه الحجج الخمس عندما يتم تقديمها عير السلطات 
القضائية والسياقات ا مختلفة؛ ومع CUS‏ فهي تشكل مجتمعة نظاما ذا منطق قوی حقق 
TTP lolo:‏ في إقناع المنظمات لفتح السيانات الخاصة بهاء لأساب ليس أقلها أنها تتو 
مع العمليات الجديدة للخصخصة (JI (Newliberalism)‏ تعزز تسويق الخدمات e‏ 
.(Bates 2012)‏ 35 الواقعء. فإن ال محرك للحجج المتعلقة بفتح البيانات في الغالب هى 
امصالح السياسية والتجارية التى تهدف إلى دفع المؤسسات العامة والمنظمات غير الحكومية 
للحصول على وصول إلى سلعة تمينة: بدلا من السعي لتحدي مفهوم الملكية الفكرية في حدّ 
ذاتها )2011 .(Verwayen et al.‏ 

في المقابل. ومما لا يثير الدهشة فى هذا السياقء أن الحجج والدعاوى لقطاع الأعمال 
لإتاحة بياناتها بحرية لإعادة استخدامها على نطاق أوسع لم يجر تطويرها والترويج لها 
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على نحو كاف. ومع ذلكء. فإن العديد من الحجج نفسها لفتح بيانات القطاع العام تصلح 
لبيانات الأعمال أيضاء أو على الأقل عناصم مختارة من هذه البيانات. ففتح البيانات من 
شأنه أن يمكن الشركات من الاستفادة من التحليل والرؤى التي تنتج بواسطة الغير من 
المستخدمين النهائيين» والجمع بين البيانات ومجاميع البيانات الأخرى التي تعمل على 
إثراتهم بطرق مثمرة. وتعزيز التعاون مع الشركاء وال موردين مما يصنع فعالية في مجال 
الخدمات اللوجستية والمنتجات الجديدة. وبناء علاقة مع العملاء تساعد على توسيع قاعدة 
العملاء وتعزيز ال ملف التعريفي للشركة وسمعتها (2012 (Deloitte‏ وعلاوة على US‏ 
فإنها قد تساعد على تطوير الشراكات بين القطاعين العام والخاصء às‏ هذا السياق تم 
اعتماد نهج الابتكار المفتوح» والذي حقق نجاحا فيما يتعلق بالبرمجيات المفتوحة؛ والعمل 
ol lua ule‏ تقاسم الموارد سينتج المزيد من القيمة التجارية دون الحرض على اكتنازها 
بغيرة والتحرز عليها. ففي الحالات التي تلقت الشركات الخاصة أموالا عامة للمساعدة 
في البحث والتظويرء يمكن إقامة دَعْوَى على أن أي بيانات تنتج عن مُثل هذه المحاولات 
ينبغي أن تكون مفتوحة إما بشكل كامل وإما بشكل انتقائي كوسيلة لإنتاج سلعة عامة 
طثل هذا الاستثمار. 


اقتصاديات السانات المفتوحة: 

هناك عدد من العوامل الكابحة / المثبطة لفتح البيانات» فبعض هذه العوامل تتصل 
بالمخاوف المتعلقة بقضايا الضمان والمسؤولية» والمخاوف بشأن الخصوصية والأمن: والحرج 
ا لمحتمل على جودة البيانات أو مداهاء والكفاءة الفنية لبناء واجهات مناسية لبرمجة 
التطسقات Programming Interfaces- APIs)‏ icationsاApp)‏ وإدارة النشة التحتية. 
وحتى الآنء فالأمر الأكثر إثارة للقلق. مع ذلك. هو الشأن اطالي. فالبيانات قد تكون غير 
متنازعة بطبيعتهاء مما يعني أنه من الممكن توزيعها بتكلفة هامشية. نظرياً على الأقل. 
ولكن ينبغي الدفع مقابل النسخة الأولية جنبا إلى جنب مع إدارة البيانات القائمة وخدمة 
العملاء (2006 عاء20110). وعلى هذا النحو. قد تمثل السانات ال مفتوحة موردا مجانبا 
للمستخدمين النهائيينء ولكن إنتاجها ومشاركتها والمحافظة عليها هي بالتأكيد ليست دون 
تكلفة معتبرة (خصوصا فيما يتعلق بالتقنيات المناسبة والموظفين المهرة). ففي كثير من 
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الحالات» كانت هذه البيانات أيضا مصدرا رئيسيا للدخل للامنظمات» وف حالة الشركات 
ميزة تنافسية. زمن ثم يرتكز السؤال الأساسى حول كيفية تمويل مشاريع فتح البيانات 
على نحو مستدام في ظل عدم وجود مصادر الدخل SU‏ لها. ولذا هناك وجهان لهذه 
المعضلة فى التمويل: فمن ناحية هناك التمويل اللازم من قبل الدولة لإنتاج البيانات وجعلها 
مفتوحة. ومن ناحية أخرى هناك التمويل للحفاظ على الممبادرات التي يقودها اممواطنونء 
والذي يعتمد على العمل التطوعى واممنح» ونماذج الأعمال التى من شأنها تمكين الشركات 
التي تستخده البيانات المفتوحة من الازدهار والتطور. 

ويختلف تمويل خدمات البيانات الحكومية بين البلدان والوكالات» ففى كتر من الحالات» 
تفرض الضرائب لإنتاج ومعالجة البيانات. ولكن في بعض النظم القانونية والحالات» تكون 
خدمات البيانات معقدة بسبب أربعة عوامل: الأولء أن إجراءها يتم بالتعاقد عليها مع 
أطراف ثالثة لإدارتها وتشغيلها بالنيابة عن الدولة. حيث يضيف الطرف الثالث قيمة 
مخصصة احتكارية أو يجعل البيانات متاحة مقابل رسم مال. وقد حدث هذا مؤخرا مع 
الرموز البريدية الأيرلندية المرتقبة التي سيتم إدارتها من قبل إحدى الشركات نيابة عن 
الدولة وستمول هذه العملية من خلال بيع وترخيص البيانات. الثانى» أن البائعين الآخرين 
يتكتلون بنشاط في سبيل وقف تقديم السانات ا مفتوحة لأنه يدمر نموذج أعمالهم. ثالثاء أن 
بعض أجهزة الدولة تعمل باعتبارها صناديق تداول تجارية» فهي لا تحصل على كل تمويلها 
من عائدات الضرائب» ولكن Me lesa‏ من دخلها قائم على بيع البيانات. فهيئة المساحة 
الأيرلندية» على سبيل «JUL‏ تعمل بهذه الطريقة كون أقل من نصف دخلها يأ مباشرة من 
الدولة في شكل إعانةء ومن المسلم به أن بعض هذه الدفعات التي تتلقاها تأت من وكالات 
حكومية أخرىء ولكنها تأق أيضا من المؤسسات الخاصة وعمليات الشراء الفردية. فإتاحة 
جميع البيانات الخاصة بها مجان يقوّض قدرتها على العمل وتمويل الخدمات الجارية 
لها. رابعاء أن جعل البيانات مفتوحة لا يتمثل بنشرها في شكل محدّد من قبل الدولة 
فقط. فالكثير من البيانات تحتاج إلى إعادة توظيفها وتنسيقها لتمكينها من أن تكون 
مفتوحة (على سبيل المثالء إبهام ا لمصدر لهاء وتجميعها) ووضع أنظمة جديدة في المكان 
ا مناسب لتحقيق هذا الهدف. وهذه ليست عملية هيّنة: وف آوقات التقشف وخفض 
النفقات يعني هذا إعادة تخصيص التمويل لتغطية تمن هذا العملء الذي هو ضروري 
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أيضا للخدمات الأساسية. وتعني هذه التعقيدات الأربعة أن التصريحات» في كثير من 
الأحيانء بأن جميع بيانات الدولة قد تم بالفعل تغطية كلّفها من خلال فرض الضرائب» 
وأنه ينبغي أن تكون متاحة بحريةء هي ليست بسيطة كما يُراد لها أن تكون. أما فيما 
يتعلق بالمبادرات التي يقودها المواطنون» فهذه أيضا لديها تكاليف فيما يتعلق بالتوظيف 
والمعدات والخدمات إذا أريد لها أن تكون مستدامة على المدى الطويل. فكيفية تأمين 
هذه اموارد خارج نطاق العمل التطوعي والهدابا Üu lu b aos JS a5‏ تعتمد هذه 
المنظمات. في الوقت الحاضر.ء إلى حد كبير على التبرعات الخيرية وتمويل الدولة. والتي لا 
LÌ Lans‏ منها ضمانات للتجديد والاستمرار. ومن ثمء فمن النتائج المحتملة المترتبة على 
التخفيضات أو التقلبات في القاعدة المالية لخدمات البيانات المفتوحة الانخفاض في جودة 
البيانات» وبط ء الاستجابة: والابتكار والآداء العام (2006 عء20110). 

Sle.l Jaleó lass‏ للسياثات المفتوحة بأن الخار.الأفضل لتأمينقاعدة مالية مستقرة 
للبيانات المفتوحة من داخل الدولة وخارجها هموعن طريق الإعانات الحكومية ال مباشرة 
لتكاليفها. ويرى أنصار هذا النهج أن زيادة الإنفاق العام يعوّض في أربع طرق: الأولى» أن 
إتاحة الوصول المباشر إلى البيانات يحد من بعض التكاليف التي يتكبّدها ال منتجون. مثل 
التوظيف المطلوب للتسويق» واممبيعات» والتواصل مع العملاء ومراقبة شروط وأحكام 
الترخيص )2006 à 0I (Pollock‏ آنه هكن للنموذج الم مفتوح الاستفاذة من العمل 
الإضافي الحر والابتكار من جموع المستخدمين التى تضيف قيمة معتبرة إلى مجموعات 
السانات وللمنظمات من ناحية حودة السانات: وتحليلهاء والمعرفة المستمدة. والمنتجات 
الحديدة والابتكارات. والعلاقات والشراكات التجارية الجديدة (:2011 de Vries et al.‏ 
OH aJ! (Houghton 2011‏ البيانات المفتوحة تنتج قيم فائضة متنوعة للمستهلكين: كما 
تولد سلعا عامة مهمة تستحق استثمار النفقات العامة فيها (2009 (Pollock‏ الرابعة» أن 
البيانات المفتوحة تؤدي إلى منتجات مبتكرة جديدة من شأنها إنشاء أسواق جديدة: وهذا 
بدوره سوف ينتج مداخيل للشركات وإيرادات ضريبية إضافية. وستكون هذه الإيرادات 
الضريبية فائضة عن التكاليف الحكومية الإضافية في فتح البيانات» وبعبارة أخرى فإن نهج 
التكلفة الصفرية أو الهامشية هي أكثر فائدة على المدى الطويل من إستراتيجيات تغطية 
التكاليف واستردادها (المفوضة الأوروبىة 2012 .(European CO0 mis$i0¬‏ 
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ولذاء يعتقد أن فتح البيانات ينطوي على إمكانية إيجاد عدة عشرات المليارات من اليورو 
me‏ في منطقة الاتحاد الأوروبي وحدها (مؤسسهة ال معرفة Open Knowledge à2 zal!‏ 
2 111012103"). ومن الأمثلة المستخدمة لدعم هذا الاعتقاد هو قرار الولايات 
المتحدة بإتاحة بيانات نظام تحديد المواقع العالمية والطقس للجمهور بحرية Pollock)‏ 
Vries et al. 2011‏ 0 :2006). حيث يدعم كل منها صناعات ملیارات الدولارات والتی 
تولد إبرادات ضريبية كبيرة وتوظفَ أعدادا كبيرة من العمال. وقد قدرت الإيكونومست 
(The Economist)‏ في العام 2013م بأن ثلاثة ملايين وظيفة ف الولايات المتحدة وحدها 
تعتمد على نظام تحديد المواقع. فلو آن أحدا قارن استخدام بيانات الطقس العامة فى 
الولايات المتحدة وأوروباء فهناك فرق شاسع في استخدامها وإنتاج قيمة مضافة عنها. حيث 
يشير (2006) 2011016 إلى أنه في حين " تساوي الاقتصادين تقريبا في الخجمء فإن صناعة 
أحوال الطقس التجارية في الولايات المتحدة هي أكبر بعشر مرات من نظيرتها في أوروبا كما 
أن صناعة إدارة مخاطر الطقس الوليدة هي أكبر بمائة مرة منها في أوروبا”. وبعبارة أخرى, 
تم alui ul‏ البيانات العامة المتاحة علنا با مجان أو بقيمتها الهامشية بطرق أنتجت عنها 
قيمة إضافية كبيرة. فأسواق البيانات المفتوحة تتعلق على حد سواء بأغراض مرتفعة (وهي 
dodo Basi‏ 5 العملا الذدن کی رو کو JEU e ala‏ 
المستهدفين بشكل كبير بالتنبؤات الجوية)» وأغراض منخفضة (وهي تستهدف أعدادا كبيرة 
فن ال تمي طلا Sla adapa AA dades T Crap. undici diae dec‏ 
الإعلانات؛ على سبيل امثال. تطبيقات 45,2 g-àns .(de Vries et al. 2011) ( 5, —Ll‏ 
التأثير ال محتمل لفتح بيانات القطاع العام في أوروبا من خلال دراسة أجريت على واحد 
وعشرين مشروعا للبيانات المفتوحة في عشرة بلدان والتى وجدت أن الانتقال إلى التكلفة 
الصفرية أو الهامشية لتكلفة العمليات التشغيلية زادت عدد المستخدمين ما بين ألف إلى 
عشرة الاف في امائة» كما جذبت العديد من الأنواع الجديدة من الملستخدمينء ولا سيما 
الشركات الصغيرة وامتوسطه (2011 .21 ]© 1165 06). وهذا يفصح عن أنه على الرغم 
من أن هناك بعض المكاسب الكبيرة. فقد بين (2013) 83765 أن غالبية الإيرادات الناشئة 
ستنتج عن سلسلة طويلة من الادخار والكفاءة والزيادة المتواضعة من التدوير. 
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وعلى الرغم من هذه الحجج. م يصدر عن هيئة المحلفين حكم قاطع حول ما إذا كان 
فتح جميع بيانات القطاع العام مكنا اقتصاديا وبشكل مستدام» وخاصة فى المدى القصير. 
فهنالك بالتأكيد حالة تتعلق بأن البيانات المفتوحة من الممكن تسويقهاء مما يؤدي إلى 
منتجات عالية ومنخفضة ا مستوى والتي يمكن بالتأكيد أن تنتج مصادر للدخل وفرص 
العمل. ومع ذلك» وکما بین )1 201( «de Vries et al.‏ فإن متوسط ما يكسبه مطورو 
التطسقات من مسعاتها [ius‏ ليس سوى ثلاثة الاف دولار فقطء مع الأخذ بالحسبان أن 
ثمانين بالمائة من تطبيقات الأندرويد امدفوعة يتم م تنزيلها أقل من مئة مرة. وبالإضافة 
إلى ذلكء فقد لاحظوا أنه حتى التطبيقات الناجحة مثل Sh‏ سيتي (MyCityWay) ,cls‏ 
التى 3 تم تحميلها iso jl‏ مليون مرةء م تنتج lb jl‏ بعد. ja uus‏ ذلك. يستثمر أضحاب 
رؤوس الأموال في مشاريع محتملة الربح مع الحاجة إلى نموذج مستدام للأعمال. وقد 
يكون من الجَيد أن يستغرق الأمر وقتا لتطوير ابتكارات وأسواق جديدة؛ فعلى JELI Jew‏ 
استغرقت الصناعات القائمة على نظم تحديد المواقع سنوات عديدة لتزدهر وتنضج بعد 
قرار جعل البيانات متاحة علنا والذي اتخذ في العام 1984م: كما قد يكون الحال أن بعض 
السيانات لها قيمة كبيرة ا ولكن دون جدوى اقتصادية. مما يستوجب عادة عدم استمرار 
اعانتها مالا اذا أريد لها أن تبقى مفتوحة بطبيعتها. 

وفي ظل غياب طرح الاكتتابات الحكومية العامة لجميع التكاليف المتعلقة بفتح البيانات 
الخاصة بهاء يجري النظر في حلول تمويلية محتملة أخرى ولا سيما نماذج الأعمال المختلفة. 
فقد بين (2013) 056112 21101 16110 تمانيه نماذج مختلفة لتستخدم: أو قد تستخدم 
Jo sa‏ مبادرات السانات المفتوحه (انظر الجدول .)۳-٤‏ ولا تستبعد يعض هذه النماذج 
ا مختلفة ls;‏ في حين تعمل نماذج شبه - مفتوحة أخرى على توفير البيانات مجانا لإعادة 
الاستخدام غير التجاريء وإلزام معيدي الاستخدام للأغراض الربحية بدفع مقابل مادي؛ أو 
الدخول في شراكات بين القطاعين العام والخاص حيث يزود القطاع العام البيانات وتقدم 
الشركات الخاصة التمويل والخدمات المضافة لإتاحة الوصول وحقوق إعادة الاستخدام 
(2008 (0801). وفى نموذج اخرء مكن بناء تحالف متلك مجموعة البيانات» وفرق 
العملء» واممواردء والأدوات» ويسهل بناء القدرات» ولكن يتقاضى رسوم العضوية من أعضاء 
التحالف لتغطية الخدمات ذات القيمة المضافة المشتركة. ويتوقف اعتماد أي نموذج. أو 
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مجموعة من النماذج» على ال مجموعة المستهدفة لتحمل تكلفة إنتاج وصيانة البيانات - 
ا مستخدمينء ال محدثين / البائعين او الحكومة - وإذا كانت ال منظمة تسعى لاسترداد التكاليف 
كاملة أو جزء هامشيا منهاء أو حتى قيمة أكبر من التكاليف الكاملة التي يمكن استثمارها 
مرة آخر ى ف الخدمة (2013 12اء05) 0ه متتزع1 :2009 عاء0[110ط). 

الحدول (ع-) 


نماذج التمويل لمبادرات البيانات المفتوحة 


ches 
انتج ال مميز / خدمة تقدّم للمستخدمين النهائيين منتجا عاليا المستوى أو الخدمات‎ 
التى تضيف قيمة إلى البيانات (على سبيل المثالء البيانات‎ 


Premium product / service 


Dlg] TESSAN‏ والتحليل) مقابل asol‏ كدفعة مقطوعة 
ثابتة» أو Sa lisi‏ )46 أو الدفع - مقابل - الاستخدام» ودون 
استخدام حقوق احتكارية. وهذا يتيح لمنتج البيانات الحصول 
على مزايا المبادرة والسبق في مجال تسويق وبيع السلع 


ا منتج المجاني / خدمة تقدم للعشتخد مين النهائيين:مجموعه متدرجة من الخيارات. 
تابنا ل خا 2 Jae JE) dul] pots cio‏ 
المثالء ميزات محدودة أو عينات من مجموعات السانات)» 
مع خيارات أكثر تقدما تحقق قيمة مضافة بمقابل رسم مالى. 
تفتح المنتج / الخدمة على سوق أكبر اتساعا وأكثر شعبية 
وامزيد من الاستخدام العرضي الممتدء مع الاحتفاظ بالخدمات 
/ امنتجات ال مدفوعة. عالية المستوىء المتاحة للمستخدمين 
الأكثر تخصصا. 
المنتجات مفتوحة ال مصدر تقدم منتجات / خدمات للمستخدمين النهائيين مجانا دون 
مقابل» حيث تدعم من خلال سبل التمويل الأساسية الأخرى 
أو غيرها من المنتجات / الخدمات. 


Freemium product / service 


Open source 
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نموذج الهدية الترويجية (البنى يعرض المنتج او الخدمة ابتذاء با مجان أو بقيمة مخفضة 
التحتية على نسق ماكنة الحلاقة | (ماكنة الحلاقة) مما يشجع على المتابعة بالاستخدام ا مدفوع 
والشفرات) مقابل (الشفرات). وقد يكون إتاحة الوصول إلى واجهات 
برمجة التطبيقات بالمجان. ولكن يكلف هذا الاستخدام 
المحوسب المستخدمين على نموذج دفغ المستحقات أولا بأول 
(بحسب الاستخدام)» مع دعم هذا النموذج الأخير (الشفرات) 


Infrastructural razor and 
blades 


للنموذج الأول (ماكنة الحلاقة). 

المنصة الموجهة بالطلب تقدم خدمات ذات قيمة مضافة عن طريق تنظيف» وتكريرء 

وتوحيد» وربط البيانات مما يوفر مجموعة قياسية من 
الأدوات التحليليةء وإتاحتها من خلال متجر شامل (متجر 

الشباك الواحد) وتحميل المستخدمنن التكلفة من خلال 
saa‏ ال مجانی او ا ممیز(تتصاعد تدر یجیاربخټارات 1 و2 

لاكتساب الكفاءة). 

يُعطى مطورو البرمجيات حرية الوصول إلى البيانات لإنشاء 
الخدمات والمنتجات التي يمكنهم بيعها إلى هيئات القطاع 
العام والتي يمكنها بدورها أن تجعلها متاحة للآخرين من 
خلال نموذج المنتجات المجانية. 
pads‏ المنتججات:/ الخدمات مجان ولكن يتلقى المستخدمون 

إعلانا عند استخدام المنتج / الخدمة (المدرّة للدخل) أو 
تقدم المنتجات / الخدمات من قبل شركات مختلفة وتوصف 
بالعلامات التجارية لها لتشجيع استخدام منتجاتها وخدماتها 
الأخرى (الدعم المتبادل). 
تطوير العلامة البيضاء يتم إنشاء منتج / خدمة مخصصة للعميل وتخمّص 


Demand-oriented platform 








امنصه الموجهه بالتزويد 


Supply-oriented platform 









\Free with advertising 







لاستخذامه الخاصء مع دفع العميل رسوما لمرة واحدة أو 
اشتراك يتضمن تكاليف الصيانة والتحديث. 


White-label development 





. (Ferro and Osella (2013 المصدر: حمعت من‎ 
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JUI Laii 


المخاوف المتعلقة بالسانات المفتوحة: 

باستثناء الكيفية اللازمة لتمويل مستدام لمبادرات البيانات المفتوحة. والخسائر 
المحتملة للشركات التى قامت ببناء نماذج أعمال قائمة على إعادة بيع بيانات القطاع العام 
Vries et a1. 2011(‏ مd)»‏ سيظهر للوهلة الأول أن هناك عددا WE‏ من السلسات الناتحة 
عن فتح السيانات العامة للجمهور لاعادة استخدامهاء وأن هناك العديد من الايجابيات. 
ومع ذلك: فقد بدأ في الظهور 8 عدد من الانتقادات المضادة التي تزعم أن حركة 
السانات امفتوحة ليست محمودة من الناحية الساسية او الاقتصادية. حيث إن بعض 
العناصر زائفة ف أهدافهاء وعلاوة على ذلك» أن هناك عددا من التبعات الضارة التى 
مكن أن تنجم عن فتح البيانات ويتضرر منها بعض المواطنين. ولا توحي هذه الانتقادات 
بفكرة التخلي عن التوجه نحو فتح البيانات» ولكن تؤكد على وجوب أن تكون مبادرات 
البيانات المفتوحة|أكثر وعيا وتكقلا في إتاحة البيانات. وكيفية استخذاقها؛ وطرق تمويلها. 
ويمكن تقسيم هذه الانتقادات إلى ثلاث فئات رئيسية: تسهيل البيانات المفتوحة للتوجه 
للخصخصة (تأييد الرأسمالية المظطلقة وعدم تدخل الدولة في الاقتصاد) والهيكلة التسويقية 
للخدمات العامة؛ وأنها تروّج لسياسة توسعية وتزيد سلطة المتسلط؛ وأنها تفتقر إلى 
الاستدامة» والأدوات» وسهولة الاستخدام. 


الخصخصة والهدكلة التسويقرة للخدمات العامة: 

برهن (2012) 8365 0[ على أن «المبادرات ال مفتوحة مثل السانات الحكومية المفتوحة 
(Open Government Data -OGD)‏ 455 كعملية تاريخية؛. وليست وقائع محايدة». 
فكما هو الحال مع كل المبادرات السياسية» فإن سياسة البيانات ال مفتوحة ليست ببساطة 
بديهية أو محايدة: بل هي ترتكز على عقيدة سياسية واقتصادية. فحركة البيانات المفتوحة 
متنوعة وتتكون من مجموعة من الدوائر الانتخابية ذات أجندات وأهداف مختلفةء وليس 
الدافع من ورائها مجرد أي طرف واحد منها. ومع ذلك» ob Batescizo‏ عامل الشد السیاسی 
في حالة حركة البيانات ال مفتوحة في المملكة المتحدة كان o‏ حتى بدأت الشركات الكبرى 
تنشط بتكتلها في حملات دعم السانات ا لمفتوحة. وبدأت المبادرات الحكومية المفتوحة 
تنسجم مع برامج التقشف القسري والهيكلة التسويقية للخدمات العامة. فبالنسبة لها 
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قد استولت الأحزاب السياسية وقطاع الأعمال على حركة البيانات المفتوحة لصالح ال مصالح 
الرأسمالية ال مهيمنة تحت ستار أجندة / جدول أعمال الشفافية (2012 823]65). 


وبعبارة آخرى» فإن جدول الأعمال الحقيقي لقطاع الأعمال هو الحصول على البيانات 
المنتجة بتكلفة باهظة دون أي مقابلء ومن ثم الوصول إلى البنية التحتية MM‏ 
بشكل كبير مما يمكنهم من الاستفادة من الأرباح» وفي الوقت ذاته. إزالة القطاع العام من 
السوق واضعاف موقعه بصفته liis‏ طثل هذه السيانات. ولذاء فيسبب اختفاء الدخل 
من خدمات البيانات (كما في الحالات التي جرى تمويلها من الرسوم وليس من دافعي 
الضرائب)» ومن ثم اختفاء التمويل اللازم لدعم الإنتاج والإدارة المحلية الداخلية» تم دفع 
هيئات القطاع العام إلى الاستعانة بمصادر خارجية لمثل هذه الخدمات من القطاع الخاص 
على اسس تنافسية او التخلي عن إنتاج البيانات للقطاع الخاص التي عليهم بعد ذلك 
شراؤها منهم (2013 2ذع]15نا). وهناء يتعين شراء خدمات البيانات والبيانات ا مشتقة 
من البيانات المفتوحة المتاحة بحرية من منشئ البيانات» في الوقت نفسه الذي يتم إفراغ 
المعارف الآولة لسانات المنظمة. وعلاوة على 3« وحيث إن البيانات ال مفتوحة تتعلق ف 
كثير من الأحيان بأنشطة الهيئة نفسهاء وخصوصا عند اشتمالها على مؤشرات قياس الأداء 
الرئيسية» فهي تعمل على تسهيل إصلاح القطاع العام وإعادة تنظيمه مما يعزز الخصخصة. 
وروح الإدارة العامة الجديدة ومصالح القطاع الخاص (2011 1.0280 :2011 (McClean‏ 
فمثل هذه العمليات» كما Bates (2013) eus‏ هي جزء من إستراتيجية سياسية مرسومة 
لفتح وإتاحة كافة الخدمات العامة 3 Lo à:‏ للمنافسة بين مزودي الخدمات من القطاع 
الخاص والقطاعات الأخرىء حيث يعمل فتح البيانات الخاصة بالخدمات العامة على تمكين 
مستخدمي الخدمة من استحداث خيارات معلومة ضمن سوق الخدمات العامة على أساس 
التطبيقات التي تعتمد على البيانات التى ينتجها مجموعة من مطورو القطاعات التجارية 
وغير التجارية (2013: التعبير الأصلي). وف مثل هذه الحالات» فإن جدول أعمال الشفافية 
التي يروج لها السياسيون وقطاع الأعمال هو مجرد تعبير مجازي. فإذا كان أي من الطرفين 
مهتما lio‏ في الشفافية والحكومة ال مفتوحة فإنه سيكون داعما بالتساوي للحق في حركة 
امعلومات والعمل المتعلق بإفشاء الأسرار (2012 31155611[) وكذلك تخفيف القيود عن 
حقوق الملكية الفكرية على نطاق أوسع (2013 US o Yg (Shah‏ فإن الحكومات 
والشركات بشكل عام مقاومة لهما على حد سواء. 
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السياسات التوسعية وتمكين الممكن: 

هناك جدل ذو صلة يتمثل ف أن الغالب فى حركة البيانات المفتوحة مدفوع من 
وجهة نظر فنية واقتصاديةء ويركز بشكل كبير على إتاحة الوصول إلى البيانات» وليس على 
سياسات البيانات نفسهاء وما قد تكشف عنه» أو كيفية استخدامهاء ولمصالح من تصبّ 
(Shah 2013)‏ وبعبارة أخرى» تسعى الحركة بشكل كبر إلى تقديم صورة تظهرها على 
أنها محببة وبديهية». وتعزيز الاعتقاد بأن فتح البيانات بطبيعته شيء جيد في حد ذاته. 
وبالنسبة لآخرينء فإن إتاحة الوصول إلى البيانات هو مجرد وجه واحد فيما يتعلق بمفهوم 
الانفتاح: وعلى القدر نفسه من الأهمية هو ما تتكؤن البيانات منه» والكيفية التي يمكن بها 
إنشاء مجتمع أكثر اعتدالا وإنصافا. فإذا كانت حركة البيانات المفتوحة تخدم فقط المصالح 
الر TM‏ من خلال فتح البيانات العامة. وتحتفظ بالبيانات الاحتكارية الخاصة خلف 
أنظمة جدران الدفع (بمقابل رسوم الاشتراك) وحمايتها بأنظمة الملكية الفكرية» وتمكن 
بصورة أكبر أولئك الممكنين بالفعل وحرمان الآخرين منهاء فإنها تكون قد فشلت في جعل 
المجتمع أكثر دمقراطية وانفتاحاً )2013 (Gurstein 2011; Shah‏ 

ففكرة أن البيانات محايدة وموضوعية في طبيعتها تطرح ضمنا في معظم المناقشات 
امتعلقة بالسانات المفتوحة وآن للكل إمكانية الوصول لهذه البيانات واستخدامها 
.(Gurstein 2011; Johnson 2013)‏ بيد أن القضئة لست UIS‏ فمع الاحترام لفتح 
DUI‏ نفسها يؤكد )2013( 3 وجود درجه عالية من الامتياز الاجتماعي والقيم 
الاجتماعية الكامنة ضمنا ق بيانات القطاع العام فيما يتعلق ماهيه البيانات اممنتجهء 
وتعلقها بمن وطاذا (لا سيما في المجالات التي تعمل كأنظمة تخصصية» مثل أنظمة الرعاية 
الاجتماعية: وأنظمة إنفاذ القانون): التي Lias‏ مصالحها ضمن مجموعة البيانات وأيضا 
تلك التي يتم استبعاد مصالحها. وهكذا فإن هياكل القيمة متأصلة في مجموعات البيانات 
والتي تشكل بدورها التصميم والتفسير لها وربما تعمل على نشر المظالم وتعزيز المصالح 
ا مهيمنة. 

فالمواطنون متفاوتون من حيث إمكانية الوصول إلى الأجهزة والبرامج المطلوبة لتحميل 
ومعالجة مجموعات البيانات المفتوحة» كما أن لهم مستويات مختلفة من المهارات اللازمة 
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hlo‏ وتأطبرء وتفسير البيانات (2011 61115]©112). وحتى لو امتلكت بعض ال مجموعات 
القدرة على تقديم فهم مقنع للبيانات» إلا أنهم لا هلكون بالضرورة الاتصالات اللازمة 
لاكتساب التأيبد الجماهيري والتأثير على النقاش, أو الحنكة السياسية بمقابل خصم جيد 
التجهيز والدهاء. ومن ثم» فإن الدهوقراطية المحتملة للبيانات المفتوحة مفرطة ف التفاؤلء 
إذا أخذ بالحسبان معظم المستخدمين الذين لديهم درجة عالية من المعرفة التقنية وملف 
تعريفي سياسي قائم (2011 21ء1 »)M‏ فالواقع «sl‏ مكن للبيانات المفتوحة أن تعمل على 
زيادة تمكين السلطة وإعادة إنتاجها وتعميق اختلال توازن .(Gurstein 2011) $53Jl‏ ومن 
الأمثلة التى يستشهد كثيرا بها على هذا الأخير هو رقمنة سجلات الأراضي في ولاية كارناتاكا 
.»)Karnata2(‏ الهند» حيث عمل مشروع البيانات المفتوحة. والذي تم الترويج له باعتباره 
مبادرة لصالح الفقراء» على حرمان الفقراء من خلال تمكين ذوي اموارد امطالية والمهارات من 
الوصول إلى البيانات التي سبق حجبها وإعادة اقتطاع أراضيهم بوضع اليد بغية الاستيلاء 
.(Gurstein 2011; Slee 2012; Donovan 2012) de‏ لقد سهلت السانات اممفتوحة 
في هذه الخالة: وَبَعَيَدَا عن العمل على مساعدة كل المواظنين, على التغيير في حقوق ملكية 
الأرض ونقل الثروة من الفقراء إلى الأغنياء. وبعبارة أخرىء فإن فتح البيانات لا يعني عملية 
متأصلة ف الدممقراطية وتعزيزهاء بل إن الواقع أنه يمكن للبيانات المفتوحة أن تعمل أداة 
للسلطة التأديسية (2013 :ه0[50[). 

ومن المهم هنا أن التنبّه إلى أن إنتاج البيانات الحكومية يكون لأغراض الحوكمة, 
وهي تتألف من نوعين رئيسيين: الأنشطة المتعلقة بأنشطة الدولة والأنشطة المتعلقة 
بالمواطنينء والأماكن: والأعمال. فالنوع الأول يهتم بكيفية عمل الدولةء وعند إتاحة هذه 
البيانات بشفافية» هكن استخدامها لتقييم الأداء والمساءلة. وقد يقف قلة ضد جعل 
مثل هذه البيانات متاحة للجمهورء على الرغم من الحاجة لتقدير مثل سياسات المكاشفة 
هذه. خاصة إذا كانت التدابير المستخدمة ذات تأثير مشوه لتقديم الخدمة وتعمل على 
التلاعب ببيانات التقييم (بالتوافق مع قانون كامبل -1:217آ 0115م212)- انظر الفصل 
السابع). وهذا يؤثر بدوره سلبا في ماهية الخدمات المقدمة وجعل الحياة سيئة لأولئك 
الأشخاص الذين يتلقون الخدمة. ويتكون النوع الثاني من السجلات الشخصية وامطؤسسية 
الحساسة للغاية. وم يتم إنشاؤها بهدف مشاركتها وتبادلها مع الاخرين. وف الواقع. 
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يتوقع ال مواطنون لها أن تكون محمية بموجب قوانين الخصوصية وحماية البيانات. وحتى 
عندما يتم تجريد هذه البيانات من البيانات التي تشير إلى هوية أشخاص معينين أي 
جعلها مجهولة (41101337211560) وعرضها مجملة: فإنه ممكن للبيانات أن تكون على 
درجة من الحساسية والسياسية بصورة كبيرة. فخذ. على سبيل المشالء بيانات الرعاية 
الاجتماعية والصحية المنقحة نسبياً وا مجمعة في وحدات مكانية (على سبيل ا مثال» مستوى 
الحي). فهذه البيانات تمثل أداة لتوجيه التدخلات الموجهة الرامية إلى معالجة المعوقات 
الاجتماعيةء كما أن لها إسهامات مفيدة في تحليل البيانات التي تسعي اجتماعيا إلى فرز 
المواطنين والتعريف عنهم فيما يتعلق بالقروض الائتمانية والتأمين ضد ال مخاطرء ويمكن من 
ثم استخدامها لإنشاء ملفات تعريف مناطقية والتي توصم موضعا ما وتحدّ من الاستثمار 
فيه (انظر الفصل العاشر). وبعبارة أخرىء ممكن إعادة توظيف السانات لأغراض مختلفة 
بطرق شتق والتي.لها مخرجات متباينةء وهناك أسباب مشزوعة لتوخي -الخَذرٌ فيما يتعلق 
ما يتم الإفراج عنه من البيانات الحكومية ومقاومة شعار التبسيط ال مستخدم من قبل بعض 
المدافعين عن البيانات المفتوحة "إنها بياناتناء لقد دفعنا مقابلهاء وينبغى أن يكون لنا حق 
الوصول إليها . 


الاستدامة والفائدة وسهولة الاستخدام: 

تركز الاهتمام بشكل كبير» حتى الآن على جانب توفير الوصول إلى البيانات وإنشاء 
مبادرات البيانات اممفتوحة» وكان هناك عدم إيلاء اهتمام كاف لاستدامة المبادرات والكيفية 
التي يتم بها استخدام البيانات وتوظيفها. ففى دراسة أجريت على عدد من مشاريع البيانات 
المفتوحة ال مختلفة أوضحت (2012) al.‏ ]© عذط11»1 بأن العديد منها تركز بشدة على الناحصة 
التقنيه الفنيه» ويمكن فهم هذه ال مشاريع على أنها «تزيد قليلا عن امواقع ال مرتبطة بملفات 
degi Dllo‏ ودون أى مراعاة لسهوله الاستخدام. وجودة ال محتوىء او عواقب استخدامها». 
والنتيجة هي مجموعة من مواقع البيانات المفتوحة التي تعمل أكثر كحاويات للبيانات 
أو مكبات البيانات. بحيث تفتقر إلى الصفات المتوقعة في البنية التحتية العاملة للبيانات 
والمنظمة تنظيما جيدا مثل البيانات النظيفةء ذات الجودة العالية والتي جرى التحقق من 
صحتهاء وقابليتها للتشغيل امتبادل ما يتوافق مع معايير البيانات ولها التعريف الوصفي 
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ا مناسب ومجموعات تسجيل كاملة (الوثائق ال مرتبطة بها)؛ أي سياسات المحافظة والنسخ 
الاحتياطي والتدقيق؛ وسياسات إعادة الاستخدام والخصوصية والأخلاقيات: والترتيبات الإدارية 
وآليات تنظيم الإدارة والحوكمة؛ والاستقرار المالي وخطة طويلة الأجل للتنمية والاستدامة 
(انظر الفصل الثاني). كما تفتقد العديد من المواقع للأدوات المناسبة وامواد السياقية لدعم 
تحليل الببانات: وعلاوة على ذلك فإن غالب مجموعات البيانات المنشورة تكون صعبة الأخذ 
والاستفادة منهاء حيث تتألف من تلك التي يسهل نشرها وتحتوي على بيانات غير حساسة 
كما أن لديها فائدة منخفضة id‏ وف اممقابلء غالا ما تنقى السانات الأكثر صعودرة Lis‏ 
لجعلها مفتوحة في حالة مغلقة. بسبب قضايا حساسيتها أو لأنها تتطلب المزيد من العمل 
الإداري للامتثال لقوانين حماية (Chignard 2013) SLLJI‏ 

ويتمثل جزء من المشكلة في أن العديد من مواقع البيانات المفتوحة هي استجابة عنيفة 
وجاهزة لظاهرة ناشتة: وقد تم بناؤها من قبل متحمسين ومنظمات ممن لديهم خبرة 
قليلة في أرشفة البيانات أو الاستخدام السياقي للبيانات التي تم فتحها. وقد تمّ دعمها 
والترويج لها من خلال الملتقيات المكثفة لمطوري البرمجيات (الهاكاثونات: (Hackathons‏ 
ومنتديات العطل الأسبوعية مجموعات الاختصاص (Data Dives)‏ التي تعيد طرح 
وإنتاج العديد من هذه القضايا. وكما jl McKeon (2013) and Porway (2013) asi‏ 
هذه الأحداث والتجمعات التي تدع و المبرمجون والأطراف المعنية الأخرى لبناء تطبيقات 
edes‏ البيانات المفتوحة لها فائدة محدودة. ففي حين حين أنها تركز الاهتمام على السانات 
وعد وسيلة جددة للتؤاصل: إلا أن أولتك الذين يقؤمون بالترمجة :غالبا ها يقتقرون I‏ 
امعرفة السياقية ال معمّقة قيما يتعلق مما تشير البيانات 9l «4J]‏ ينتمون الى مجموعة سكانية 
معينة ليست بالضرورة معبرة عن شريحة مجتمعية أوسع نطاقا (على شيل الثال:.الشبات 
والمتعلمون والتقنيون)ء ويظنّون أن المشاكل الهيكلية العميقة يمكن حلها من خلال الحلول 
التقنية. إنهم «كيان مؤلف من مجتمع صغير من المتطوعين المتحمسينء وليسوا من 
الأشخاص الذين لديهم مصلحة كبيرة في رؤية ال مشروع ينجح» (2013 2هعك1ء81). وعلاوة 
على US‏ لا تزال الحلول التي تم إنشاؤها في هذه اللقاءات على إصدارها الأول» مع قليل 
من المتابعة بعد انتهاء الحدث ودون تحديث أو صيانة أو تطوير لاحق. وكان جواب 
x Jal» «UJ Porways (2013)‏ لتغيير مناسب هو الجمع بين أولئك الذين يفهمون 
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البيانات والمشكلات القائمة على أرض الواقع مع أولئك الذين يستطيعون برمجة التطبيقات 
وبنائها والمحافظة عليهاء وقد اقترح (2013) 1112601 عقد اجتماعات تخطيطية مسبقة 
وتوصيات توجيهية بعد الحدث تهدف إلى استدامهة المخرجات وإنشاء مجتمع على المدى 
الطويل. وبعبارة أخرىء هناك حاجة للتوفيق بين الخبرات الموجودة والخبرات في تطوير 
التطبيقات. والحاجة نفسها مطلوبة مع مواقع البيانات ا لمفتوحة. حيث تتطلب تعلم 
الدروس المستفادة من أولئك الذين عملوا لفترة طويلة سابقة في الأرشفة وقطاع أعمال 
تاذل البيانات: متضهنا ذلك آمتاء المحفوظات الأرشفية والعلماء والجغرافيون. 

ونتىجة لهذه القضابا العويصة ال مختلفة: Jus‏ من اإنشاء دورة إنجابة (Virtuous Cycle)‏ 
بحسب ما تفترض حركه البيانات المفتوحة. حيث الإفراج عن امزيد وامزيد من مجموعات 
البيانات؛ قي المزيد من الأشكال والصيغ: ينتج عنه مزيد من الاستخدام: ومن ثم الإفراج عن 
المزيد من البيانات مستقبلا إلا أن العديد من المواقع, كما لاحظت )2012( Helbig et al.‏ 
عانت من انخفاض معدلات التصفح لها وتراجعها لأنها لا تشجع على الاستخدام أو لا تقدم 
التسهيلات للمستخدمين في هذا الخصوصء وتقتصر خدماتها على عوامل أخرى مثل ممارسات 
إدارة البيانات وعرض الجهد المؤسسي المبذول والسياسات الداخلية ال معمول بها. فبعد الشرارة 
الأولى من الاهتمام» تراجع استخدام البيانات بشكل ملحوظ للغاية بسبب الكشف عن القيود 
المفروضة على البيانات ومحدوديتها ونضال المستخدمين من أجل إيجاد طرق لكيفية استخدام 
وتحليل البيانات بشكل مربح. وقد لاحظ )2011( Ldi ol JELI Law ple McClean‏ 
الناشنئ عن اليانات المفتوحة كان له تآثير محدود على النقاشات السياسية: وخلص فيما 
يتعلق بنظام المعلومات ا مجمّعة على الإنترنت (كوينز 01715©) الخاص بالبيانات المالية 
الحكومية في المملكة المتحدة. إلى أنه بعد 

هبّة قصيرة من اهتمام وسائل الإعلام في منتصف عام 2010, وفي أعقاب إطلاقه.... 
فإن التقارير التي تشرر صراحة إلى نظام كويّنز غدت الآن نادرة للغايةء كما أن العاملين في 
الصحافة الذين كانوا الأكثر اهتمامًا بالحصول على حق الوصول إليه قد صرّحوا بأنه م تنبت 
فائدته كمحرك فاعل للصحافة على وحه الخصوص. 
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وحيث يتم نشر البيانات دوريا على سبيل «JU LI‏ بصورة فصلية أو سنوية. فإن 
الاستخدام SE ol di Je‏ دوريا وغالما مرتبظا مشاريع محددة مثل التقارير الاستشاردة 
بدلا من وجود نمط أكثر ثباتا من الاستخدام الذي قد يتوقعه المرء لبيانات تتغير بطبيعتها 
آنا بصورة مستمرة أو لديها قيمة اقتصادية عالية. ففي مثل هذه الحالات. لاحظت 
(2012) .21 »© عذط11»1 أن مجموعة من حلقات ردود الفعل السلبية قد أبطأت توفير 
البيانات واستخدامهاء ومن ثم زيادة خفض الاستخدام. ولذاء فبعد بعض «المكاسب 
السريعة» الأولية» يكمن الخطر في تحوّل أي دورة إيجابية من كونها إيجابية إلى سلبية, 
وتقويض الأساس امنطقي لتمويل الحكومة المركزية مثل هذه المبادرات وكونها عرضة 
للتوقف المفاجئ. إن اطفتاح لتجنب نشوء مثل هذه الدورة السلبية هو التأكد من 
تركيز أي مباذرة بأكبر قدر ممكن على جانب الطلب كما في جانب العرضء وأنها توفر 
للمستخدمين بيانات قابلة للتشغيل المتبادل والآدوات التحليلية وغيرها من الخدمات 
التي تسهل استخدام وإضافة قيمة للبيانات. بدلا من مجرد ربط المطلفات. 


الخلاصة: 

عند أحد المستويات» تعد قضية البيانات اممفتوحة والبيانات المرتبطة بديهية - حيث تسهم 
البيانات المفتوحة في صنع الشفافية والمساءلة والمشاركة والاختيار والابتكار الاجتماعي والكفاءة 
والإنتاجية وتعزيز الحوكمة والابتكار الاقتصادي وتكوين الثروات. في حين تعمل البيانات المرتبطة 
على تحويل المعلومات الموزعة عبر شبكة الإنترنت إلى شبكة دلالية يمكن من خلالها القراءة الآلية 
للبيانات وربطها معا. وعليه تحمل البيانات المفتوحة والبيانات المرتبطة في طياتها الكثير من 
الوعود والآمال والقيمة مع اعتبارها Mie‏ محفوفة با مخاطرء فواقع الحال بالنسبة للبيانات 
المفتوحة والسانات المرتتطة أكثر 5 تغقيدا كما أن الأسس الاقتصادية لها لسست واضحة على 
الإطلاق. ويبدو أن للسانات ال مفتوحة والسانات المرتطة تكالىف هامشة قليلةء ولكن الحاجة 
قائمة في عملية إنتاجها والطاقم الفني والجهاز المؤسسي لتسهيل استخدامها والحفاظ عليها مما 
يلزم تكاليف حقيقية من حيث العمالةء واممعدات» وامموارد. وف الواقع» فإن البيانات المفتوحة 
بعيدة كل البعد عن كونها مجانية» ولكن حتى الآنء م يتم وضع نموذج متماسك لتمويل مستدام 
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الفصل الثالث 


مبادرات البيانات المفتوحة دون إعانة حكومية. كما أن فوائد البيانات المفتوحة من حيث إنتاج 
قيمة مضافة على فائض الاستهلاك والمشاريع التجارية الجديدة؛ والمنتجات المبتكرة: والتكاليف 
قد قابلها إيرادات ضريبية إضافية افتراضية إلى حد كبير أو بدأت بالتحقق فقطء وعلاوة على 
ذلك. فإن العواقب السلبية ال محتملة لفتح البيانات لم تستكشف بعد بالكامل. 

فهناك حاجة إلى الدفع بمزيد من الاهتمام النقدي لكيفية تطور مشاريع البيانات المفتوحة 
كظاهرة تقنية اجتماعية مقعدة ومرتبطة بطائفة متنوعة من البرامج. وا معنيين» واصحاب 
المصلحة. وحتى «OV!‏ تمحورت الجهود حول العمل السياسي والتقني المتعلق بإقامة مشاريع 
البيانات المفتوحة؛ وم يتم العمل بشكل كاف على دراسة هذه التحركات المادية والتي تلامس 
العديد من الجوانب وعواقبها. ونتيجة لذلكء فإننا نفتقر إلى دراسات الحالة التفصيلية لتطبيق 
مشاريع البيانات ال مفتوحة. والتجمعات ال محيطة بهاء والتي تعمل على صياغتهاء والطرق 
الفوضوية:. والطارثة والعلائقية التى تتكشف بمرور الوقتٌ. ولن تظهزاضورة أكثر اكتمالا 
للبيانات المفتوحة والبيانات ال مرتبطة إلا من خلال مثل هذه الدراسات التى ستكشف عن كل 
من الإيجابيات والسلبيات مثل هذه المشاريع وتوفر إجابات عن أسئلة معيارية بشأن الكيفية 
التي ينبغي تنفيذها بها ومعالجة قضايا الاستدامة وسهولة الاستخدام والسياسات المتعلقة بها. 
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الفصل الرابع 
البيانات الكسسيرة (Big Data)‏ 


تتبع )2012( Liz. Francis Diebold‏ استخدام مصطلح «البيانات الكبيرة» إلى منتصف 
التسعينيات (1990s)‏ حيث استخدم Jay‏ مرة من قبل جون (John Mashey) $l‏ 
كبير العلماء السابق ا متقاعد من شركة سيليكون غرافيكس» للإشارة إلى معالجة وتحليل 
مجموعات البيانات الضخمة. وقد كان المصطلح قليل الجذب ف البداية. ففي العام ٠٠١8‏ 
استخدم عدد قليل جدا من الناس مصطلح «البيانات الكبيرة»: سواء في المجالات الأكادممية 
أو الصناعية. وبعد خمس سنوات أصبح مصطلح «البيانات الكبيرة» التعبير الطنان الأكثر 
à les.‏ الاستخدام à‏ دوائر الأعمال ووسائل الإعلام الشعبية: مع تعليقات دورية في 
الصحف الأكثر انتشاراء JU Sto Ula (New York Times) 5&5 3,555.71! 4a 2o (zs‏ 
تامز (1112165 [12ء111:22): ومقاطع وأعداد خاصة في المجلات العامة والمجلات العلمية 
مثل عام الاقتصاد ag—lolg (Nature) d-zuh)lg (Time) S ylg (Economist)‏ 
(Science)‏ لقد كان هذا الانتشار وزيادة الاستخدام ال مرتبطة به هو ما أذى بالفعل إلى 
إعلان غارتنر (32112261) في يناير (2013) عن انتقال تقنية البيانات الكبيرة على طول دورة 
الدعاية (عاعلإ© ©م1177) (كما يطلق عليها نموذج النضج التقني) من مرحلة «ذروة تضخم 
التوقعات» إلى «مستوى خية الأمل» )2013 17 1) مع إعلان بعض الدعاة سابقا عن 
5L UI» esa‏ الكييرة» بصفته bloss‏ ذا معنى. حيث c‏ أصبح خا Ls iia‏ وواسع 
النطاق للغاية في التعريف (على سبيل المثالء 2013 (de Goes‏ فبعض أوائل الشركات 
التي تبنت المفهوم تصارع من أجل تحويل الاستثمارات في البيانات الكبيرة إلى عوائد ربحية 
والبعض يشككون في فوائدها المحتملة. ومع ذلكء. ظل قطاع الأعمال والقطاع الحكومي 
العام وممولو البحوث على قناعتهم بارتفاع منحنى التنوير (Slope of Enlightenment)‏ 
للبيانات الكبيرة fad end‏ إلى $52( 5e (Plateau of Productivity) 4 42 L5V!‏ 895 
الإعلان أو نموذج النضج التقنيء بل وأكثر من ذلك» أنها وجدت لإحداث تغيير جذري في 
كيفيهة عمل العلوم وإجراء الأعمال (2013 :1د[تاءء51: انظر أيضا للفصلين السابع والثامن). 
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الفصل الرابع 


وكما نوقش في الفصل الثاني. فقد وجدت ولفترة طويلة من الزمن مجموعات ضخمة من 
بيانات عبر الحكومات والصناعات والأوساط الأكادهية التي تم استخراج المعلومات منها 
من أجل تقديم مزيد من الرؤى وال معرفةء فالإدارات والوكالات الحكومية آنتجت بشكل 
روتيني كميات ضخمة من البيانات. على سبيل المثال. قامت إدارة المحفوظات والسجلات 
الوطنية في الولايات المتحدة في عام 7١1‏ بتخزين ما يقارب 4,5 مليون قدم مكعب من 
الوثائق المادية من وكالات السلطة التنفيذية الأمريكية: والمحاكم:. ومجلس النواب» ومقر 
الرئاسة (وهي خمسة ف المائة من سجلات الحكومة الاتحادية) مما يضيف ثلاثين ألف 
قدم بصورة خطية سنويا (2013 581115): بالإضافة إلى خمسمائة تيرابايت من البيانات 
الرقمية. كما تم بالمثل جمع بيانات للشركات عن عملياتهاء والأسواق» والعملاء وقواعد 
بيانات هائلة من البيانات العلمية التى تمّ جمعها ومشاركتها من بداية العلم الحديث. 
لذلكء ما المقصود من مصطلح «البيانات الكبيرة». بالنظر إلى كميات البيانات الناتجة في 
المجالات السابقة؟ 

فكما هو شأن العديد من ا مصطلحات المستخدمة للإشارة إلى الاستخدام المتسارع في 
التقنيات واممارسات. لا يوجد تعريف أكاديمي محدد أو صناعي متفق عليه لمصطلح 
البيانات الكبيرة: إلا أن الكثير من التعاريف الشائعة تشير إلى الثلاثية الل مكررة للأحرف 
الابتداتئية (3775) للخصائص المميزة للبيانات الكبيرة: الحجم (1701111116): والسرعة 
(Velocity)‏ والتنوع (2012 .21 —SbUJlà .(Variety) (Laney 2001; Zikopoulos et‏ 
الكبيرة تتميز بأنها: 
e‏ ضخمة في الحجم» أي تتكوّن من تيرابايت أوبيتابايت من البيانات. 
٠‏ عالية السرعة: أي أنها تنشأ بشكل آني أو فوريء أو قريبا من الزمن الحقيقي. 
o‏ مختلفة من حيث تعدد تنوعهاء حيث تتنوع البيانات بين المنظمة وغير المنظمة في 

طبيعتهاء كما تتنوع في الغالب من حيث مرجعيتها الزمانية والمكانية. 

فخلال زمن ما قبل السيانات الكبيرة. تقيدت قواعد البيانات بين هذه الخصائص الثلاث: 
حيث كان من الممكن لقاعدة البيانات الجمع بين خاصيتين اثنتين في ان واحد (ضخمة 
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PSI السانات‎ 


وسر دعة» متنوعة وسريعة:؛ وكبيرة ومتنوعة) (2012 1011 )). إلا أنه مع تعزيز قدرة المعالجه 

الحاسوسة: والتصاميم الجديدة لقواعد السانات» والتخزين الموزع (انظر الفصل الخامس)ء 

أصبح تحقيق الثلاثة مجتمعة في وقت واحد ممكنا مما يتيح أشكلا جديدة للتحليل 
وتقديم عروض مفصلهة للغاية للنظم الضخمه والمتغيرة باستمرار. وعدا عن الخصانص 

الثلاك السابقة. انارت اللؤلفات الضاذرة مؤخرا إلى غذة من الخضائص الرئيسة الأشرف: 

عبت تتميز:التيانات الكبرة أيضا باكيزات الغالية: 

2 شاملة في نطاقها. حيث تسعى لتغطية كامل مجتمع أو نظم الدراسة (ن = الجميع). أو 
على الأقل توفر حجم عينات أكبر من تلك التي يجري استخدامها في دراسات البيانات 
التقليديه أو الصغيرة. 

٠‏ متناهية في دقتهاء حيث تهدف إلى أن تكون مفصّلة قدر الإمكانء ومفهرسة بشكل فريد 
في تحديد الهوية. 

o‏ علائقبة بطسيعتهاء كونها ” تحتوى على حقول بيانات مشتركة تمكن من الربط بين 
مجموعات سانات مختلفة. 


o‏ مرنه» حيث تحمل سمات التفرع (يممكن إضافة حقول بيانات جديدة بسهولة) مع قابلية 

التوسع (يمكن التوسع في حجمها بسرعة). 

boyd and Crawford 2012; Dodge and Kitchin 2005; Marz and Warren) 
.(2012; Mayer- Schonberger and Cukier 2013 

وبالنظر إلى الحملة الدافعة إلى التحويل الرقمي (الرقمنة- Sb5UJ (Digitisation‏ 
التقليدية الصغيرة والتوسع فيها ضمن البنى التحتية الرقمية التي تتميز بالضخامة والتنوع 
مثل ا محفوظات الأرشيفية الوطنية: التعدادات السكانية: واللمجموعات الثقافية والاجتماعة 
التراثية؛ انظر الفصل (UI‏ فقد كانت السرعة والخصائص الإضافية هي ما ميزت البيانات 
الكبيرة وجعلت منها ابتكارا استثنائا (1997 11156]6156115)) وغير بصورة جذرية طبيعة 
البيانات وما مكن عمله من خلالها (انظر الجدول .)7-١‏ فعلى سبيل امثالء يتميز ا للسح 
الأسري الوطني بكبر الحجم. والدقة المتناهية؛ وقوة العلائقية: إلا أنه يفتقر إلى السرعة 
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الفصل الرابع 


(تتغير البيانات مرة واحدة في السنة )» والتنوع (يتكؤن من ثلاثين سؤالا منظما): والشمول 
(حيث تقتصر العينة على فرد واحد من عشرين أسرة)» وا مرونة (كون حقول البيانات 
ثابتة ولا تتغير خلال المسوحات المتعاقبة للتمكن من تحليل السلاسل الزمنية). ففي هذا 
الفصل تم إيراد الخصائص السبعة للبيانات الكبيرة ويناقش الفصل التالى العوامل اممساعدة 
للبيانات الكييرة ومصادرها. 


:(Volume) الحجم‎ 

شهد العقد الماضي انفجارا ف كمية البيانات التي تم إنتاجها ومعالجتها بشكل يومي. 
وكما عنونت مجلة وايرد (111160) بشكل رئيس في عددها الخاص للعام 2008: نحن ندخل 
«عصر التيرابايت» (وفي الواقع. لقد ولجنا بالفعل في عصر الزيتابايت؛ 7072 بايت). وقد 
سعت العديد من الدراسات لتقدير وتتبّع الأحجام ا معنية (على سبيل المثال: Hilbert and‏ 
.(López 2009; Gantz and Reinsel 2011; Short et al. 2011‏ واستخدمت هذه 
الدراسات منهجيات وتعاريف مختلفة» ولكنها أجمعت بالكلية على أن معدل نمو البيانات 
كان YR‏ في نطاقه. وعلاوة على ذلك: فهي al bb gail de å$‏ أكير في ا ملستقبل 
المنظور. إن أبسط طريقة لتوضيح هذا النمو هو إعطاء بعض الأمثلة على تقديرات عاللية 
لأحجام البيانات وبعض التقديرات المتعلقة بكيانات محددة» ولتوفير إطار مرجعى» يفصل 
الجدول )٤-١(‏ بصورة مختصرة كيفية قياس حجم البيانات. 

الجدول )*-£( 


نٿ Lol JLO (b)‏ هي اختصار لتعبير «الخانه ca «a SUI‏ تستخل مك 
الحاسبات لتخزين ومعالجة البيانات على صورة الرمز 
الثنائي (0 أو1) 


DR cob‏ نمانية obl‏ ثنائية | مساحة تخزينية كافية لتمثيل رموز الأبجدية الإنجليزية 








)8 بت) والأرقام باستخدام الرموز الثنائيه 
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LI‏ الكبيرة 


كيلوبايت 0 أو210 بايت | من كلمة «الألف» (1120015320) باليونانية. فالصفحة 
(KB)‏ الواحد من النص ا مطبوع تقدر بحوالي 2 كيلوبايت 


Jis] Jal$à .&3bgJb (Large) كملوبايت؟ من كلمة «ضخم»‎ 0 


شكسبير الآدبية يقدر حجمها ب 5 ميجابايتات في حين 
يقدّر حجم الملف الصوقٍ الموسيقي بحوالي 4 ميجابايت 


غغابايت 0 مبجابادت؛ من كلمة «هائل» (212126)) باليونانية. ففيلم من ساعتين 
cob 230 (GB)‏ مكن ضغطه à‏ ملف حجمه 2-1 غبغابايت 


0 غيغابايت؟ من كلمة “عملاق' .ådlbgJL (Monster)‏ فالكتتب 
المفهرسة في مكتبة مجلس النواب الأمريكي (الكونغرس) 
يقدر حجمها بحوالي 15 تيرابايت 


تقدر بيانات كل الرسائل التي تم توصيلها من قبل خدمة 


بيتابايت (218) | 1000 تيرابايت؛ 250 
cob‏ البريد الأمريي في العام 2010 بنحو 5 بيتابايت. 
إكسابايت 0 بيتابايت؛ | مكافئة لبيانات عشرة بلايين نسخة من مجلة عام الاقتصاد 
(Ihe Economist) cob 260 (EB)‏ 
زيتابايت (78) | 1000 إكسابايت؛ | يقدر المجموع الكلى للمعلومات في الوجود في عام 2010 
0 بايت بحوالي 1.2 زيتابايت 
(YB) bbg‏ | 1000 زيتابايت؛ 
cob 280‏ 


حالياً هي قيمة أكبر من التخيّل 
تم وضع الاختصارات من ántergovernmental organization 4J9.Jl 44s5$.2J! 4&JA:Ll LS‏ 


cob 220 













cob 0 
















والمكتب الدولي للآو e3 .International Bureau of Weights and Measures سılahlg jlj‏ 
إضافة وحدق يوتابايت وزيتابايت في العام 1991؛ المصطلحات للكميات الأكبر لم يتم وضعها بعد. 





المصدر: مجلة عاط الاقتصاد (2010) (150:ههمء8 16): تمّ إعادة إنتاجها بإذن عالم الاقتصاد. صحيفة عام 
الاقتصاد المحدودة: لندن: الإصدار 11 مارس 2014. 

وقد بن (2012) .21 ]© 011105م م711 أنه في العام ١٠٠٠م‏ تم تخزين 0.0٠٠‏ ابتابايت 
من البيانات في العالم. وبحسب التقرير e$ e$ -Short et al. (2011: 7) J ($9 4I‏ 
امعلومات؟ - عالجت خادمات العام «Y -A els‏ 9.57 زيتابايت من ال معلومات... وكان 
هذا بمعدل ١١‏ غيغابايت من المعلومات يوميا للعامل العاديء أو نحو " تيرابايتات من 
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المعلومات لكل عامل [TN‏ وقامت الشركات فى العام بمعالجة 17 tobla‏ من المعلومات 
lista‏ باستثناء المصادر غير ا محوسبة. وبحلول عام ٠٠٠١‏ م» قدرت مؤسسة el‏ جي اي 
(MGI)‏ (بحسب ما ذکر 3 :2011 oL (Manyika et al.‏ الشركات عالميا قد قامت بتخزين 
اكثر من ٠‏ إكسابايت من البيانات الجديدة على الأقراص الصلبة ... في حين قام المستهلكون 
بتخزين أكثر من 1 إكسابايتات من السسانات الجديدة على أجهزة من قبيل أجهزة الحاسب 
الشخصية وأجهزة الحاسيب ال محمولة. كما قذروا كذلك أنه في «عام ٠٠١4‏ م: كان ما يقرب 
من كل القطاعات فى الاقتصاد الأمريي لا بقل بياناتها المخزنة بالمتوسط عن ٠٠١‏ تيرابايت 
من البيانات لكل شركة فيها أكثر من ألف موظف. كما امتلكت العديد من القطاعات أكثر 
من 1 ستابايت من السانات ال مخزنة لكل شركة». وفي عام ۲۰۱۳ م» Neelie Kroes Lèl‏ 
مفوّض الاتحاذ الأوزوبي لجدول الأعمال الرقميء بأن ١١1‏ مليون بليون بايت من البيانات 
يجري توليدها ف الدقيقة الواحدة على $525( (Rial 2013) &lsJl‏ 


وبناء على Manyika et al. (2011) 4 x2,5‏ لنمو حجم البيانات. فقد توقعوا 
ارتفاعا بنسبة BUI G E‏ $ نمو البيانات التي يتم م انشاؤها على مستوى العام aia‏ 
ob Gantz and Reinsel (2011) j3..35‏ «كمية امطعلومات التي تم م إنشاؤها واعادة 
نسخها (تكرارها) على الإنترنت ستتجاوز ١,68‏ زيتابايت (۱,۸ تريليون غيغابايت) في 
العام ٠١١١‏ مخزنة في 0٠١‏ كوادريليون (مليون مليار) ملف بيانات». ويبين هذا الذي 
ذكروه ld‏ ممقدار تسعة أضعاف خلال خمس سنوات فقطء. مع نمو متوقع في ذات 
الوقت إلى أكثر من الضعف كل سنتين. ونتيجة لذلكء فقد توقعوا في تقريرهم بأنه في 
العقد التالي: 


سيزداد عدد الخوادم (الافتراضية والفيزيائيه) في جميع أنحاء العام بعشرة أضعاف» 
في حين ستزداد كميهة ال معلومات المدارة في مراكز بيانات الشركات بمقدار خمسين dic‏ 
وسيزداد أعداد الملفات التى سوف تضطر مراكز البيانات إلى التعامل معها بمقدار lino75‏ 
على الأقل. 

ومثل هذا النمو الهائل في إنتاج البيانات. ادعت شركة اي IBM (2012) ela‏ 
oLo‏ « ٠خ‏ من البيانات في العام اليوم قد تم إنشاؤها في العاميين الماضيين فقط» 
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كيم توقع )2012( 5l Zikopoulos et al.‏ تقارب أحجام السانات حد 70 زيتابايت 
بحلول عام ١٠١١٠م.‏ 

ويمكننا إدراك وقوع هذا الانفجار في إنتاج البيانات الرقمية من خلال النظر في بعض 
الأمثلة المحددة. فشركة تك أمريكا ab c5533 (TechAmerica)‏ يجري يقن ارسال ما 
يقرب من 114 مليار رسالة بريد إلكترونية و6١‏ مليار رسالة dua‏ كما يتم إجراء ١١‏ مليار 
مكامة هاتفية على مستوى العام (2013 (Strohm and Homan‏ 5559 لشركة سيسكو 
٠ (CISCO)‏ ففي العام e Y*W‏ كان هنالك قرا ما ٠١ salo‏ مليارات عنصر (أجهزة اتصال 
ومستشعرات) مشكلة شبكة إنترنت الأشاء (Internet of Things -IoT)‏ والتى يقوم JS‏ 
منها بإنتاج كميات متغيرة من البيانات» مع الزيادة اممتوقعة لهذا الرقم ليفوق الخمسين 
bids‏ بحلول عام ۲۰۲۰ م )2013 Us]. .(Farber‏ ما يتعلق بحركة الاتصال على الإنترنت» 
فوفك اناا شركة :جوجل تعالج ‏ مليارات طلب استعلام للبحث يومياء وتقوم بتخزينها 
(Mayer-Schonberger and Cukier 2013) IS‏ وقرابة 7 ستابايت من السانات 
à (Davenport et al. 2012) ess JS‏ العام (eas «e Y «VY‏ ال ملستخدمون النشطون 
لموقع التواصل الاجتماعي فيسبوك أكثر من ,9 مليارات ساعة خلال شهر Manyika et)‏ 
(al. 2011‏ وبحلول عام 7٠١١7‏ م» ذكرت الشركة بأنها كانت تعالج ۲,۵ مليار من مختلف 
أنواع بيانات اللمحتوى (وصلات. مخازنء. صورء Lal‏ وما إلى ذلك). ولا,” ملمار من ردود 
الاعجاب وتثلاتمائة مليون عملية تحميل للصور gU3l e3 BS. .(Constine 2012) Los:‏ 
]558.36 أربعمائة مليون تغريدة PTT‏ في العام ١١١٠م‏ > معدل زيادة مقداره مئتان 
sia GUI S‏ مع احتواء كل تغريدة على ثلانة وثلاثين ls‏ من السانات الوصفية 
.(Mayer-Schonberger and Cukier 2013) l4l‏ وقد الكتر من هذه البيانات غر 
منظمة بطبيعتها. وبامثل هنالك انفجار في حجم إنتاج البيانات المنظمة قد وقع (Ae Lal‏ 
سبيل المثال وفيما يتعلق ببيانات تجارة التجزئة الخاصة بالأوراق المالية وا مبيعات» والتي تم 
جمعها من خلال السلاسل السوقية (اللوجستية) ومنافذ البيع» آنتجت سلسلة متاجر وول 
5S] (Walmart) cl‏ من ٠,١‏ بيتابايت من السبانات المتعلقة بأكثر من مليون عملية خاصة 
بالعملاء في كل ساعة ق العام 7١١٠م si»‏ يفوق ما بعادل ١11/‏ مرة من المعلومات الواردة 
في جميع الكتب ال مصنفة في مكتبة الكونغرس“«؛ 6 :2012 «(Open Data Center Alliance‏ 
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Cal US‏ متاجر تسكو dolla ,JI (Tesco)‏ اكترمن luis jus VO‏ ا من بنود السانات 
كل شهر فى العام ٠١١١‏ م )2011 (Manyika et al.‏ 


وبا مثلء تنتج الحكومات والهيئات العامة كميات هائلة من البيانات حول مواطنيها 
والدول الأخرى. على سبيل المثال» بدأت هيئات التنقل والعبور في مراقبة التدفق المستمر 
للناس من خلال أنظمة النقلء على سبيل ال مثال» جمع زمن ومكان استخدام بطاقات السفر 
مسبقة الدفع مثل بطاقة أويستر في لندن. كما يجري الآن تقديم العديد من نماذج وطرق دفع 
الضرائب أو طلبات الحصول على الخدمات الحكومية من خلال الانترنت؛ ففي العام 2009م: 
أنتحجت حكومة الولايات المتحدة 868 ستابايت من السانات (مؤسسة التقنة الأمريكة 
.(TechAmerica Foundation 2012‏ كما تعمل وكالات الاستخبارات الست عشرة التي 
تشكل أمن الولايات ال متحدةء جنبا إلى جنب مع فروع الجيش الأمريكي» على مراقبة وتخزين 
وتحليل كميات هائلة من البيانات كل ساعة. من خلال آلاف المحللين العاملين في تدقيق 
وتفسير النتائج. وللحصول على فكرة عن حجم بعض مشاريع الاستخبارات العسكرية؛ فإن 
مشروع النظام ال مستقل للمراقبة الأرضية الصورية الحقيقية (816175-15): والذي كشفت 
عنه وكالة مشاريع البحوث المتطورة الدفاعية (داربا uzg (DARPA‏ الولايات المتحدة في 
العام «e ٠١١‏ هو منصة للمراقبة بالفيديو بدقة ١,8‏ غيغابايت والتى يمكنها بيان التفاصيل 
الصغيرة حتى ست بوصات من ارتفاع ٠٠٠٠١‏ قدم (سته كيلومترات) (2013 (Anthony‏ 
TEMA‏ ۸ مليار بكسلء فى ۱۲ إطارا في الثانية ( لقطة ف الثانية » مما ينتج ما يقارب 

٠‏ غيغابت ف الثانية. وهذا يعادل نحو 1 بيتابايتات من البيانات يوميا. وباستخدام 
الحاسوب العملاقء يمكن للنظام إجراء التحليل آنيا من خلال تتبّع ما يصل إلى 76 جسما 
متحركا ضمن مجال الرؤية. وهذا هو مشروع واحد فقط في ترسانة ال مشاريع الاستخباراتية 
الممائلة وذات الصلة. 


٠٠١ فيما يتعلق بالمشاريع العلمية. يتكون تسلسل الجينوم البشري من نحو‎ (bbs 
الآلاف من الأفراد مما‎ e CàeLaz las :(Vanacek 2012) غيغابابت من السانات‎ 
يوسع قاعدة البيانات قريبا إلى تيرابايت وبيتابايت من البيانات. وعندما بدأ التشغيل‎ 
أنتج‎ 5٠٠١ العام‎ $ (Sloan Digital Sky Survey) في مسح سلوان الجوي الرقمي‎ 
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coli LI‏ (التلسكوب) في نيومكسيكو من بيانات الرصد واطراقبة في أول شهرين أكثر مما 
سبق جمعه فى تاريخ علم الفلك حتى ذلك الوقت (2010 ٠١٠١ ele (35 .(Cukier‏ م 
بلغ حجم أرشيفها ما يقارن ١2١‏ تيرابايت من البيانات. وهي كمية سيتم قريبا جمعها 
كل خمسة abil‏ من قبل امرقاب الكبير للمسح الشامل Large Synoptic Survey)‏ 
(Telescope‏ والذي نكا العمل به à‏ شيلى à‏ العام 2016 (Cukier 2010)e‏ وأكثر 
ضخامة من هذاء (Large Hadron Collider) ;.5J! 5s 53Us e3Laa‏ والذي يقوم بإنتاج 
© تيرابايبت من البيانات في الثانية الواحدة (2010 ,2012156مع8 ع11). وفي هذاء 
وغيره من الحالات. يتم إنشاء بيانات هائلة للغاية لا ومكن تحليلها أو تخزينها. بحيث 
تعد بيانات عابرة. وف الواقع» لا وجود لهذه القدرة التخزينية لكل هذه البيانات» فعلى 
الرغم من التؤسع السريع في القدرات التخزينية» إلا أن هذا التوسع لا يمكنه مواكبة إنتاج 
السانات (2011 .لد .(Gantz et al. 2007; Manyika et‏ 


:(Exhaustivity) J$22J! 
تستخدم عملية انتقاء العينات في دراسات البيانات الصغيرة من أجل إنتاج مجموعة‎ 
بيانية تمثيلية لمجتمع الدراسة من جميع البيانات ال محتملة في وقت معين ومكان معين.‎ 
وتستخدم عملية انتقاء العينات من مجتمع الدراسة بسبب كبر هذا ا مجتمع وتعذر جمع‎ 
كافة البيانات المتعلقة به محدودية الوقت واموارد ا مخصصة. ف المقابل» تسعى مشاريع‎ 
البيانات الكبيرة إلى التقاط بيانات كامل مجتمع الدراسة (ن - الكل). أو على الأقل» حجم‎ 
Mayer-Schonberger and Cukier) دراسات السانات الصغيرة‎ i من المعتادة‎ Slå Aus 
للتقنيات التى استخدمت في إنتاج‎ bab فمن ناحية: تعد هذه الببانات نتاجا‎ )3 
إلى جنب مع النمو الهائل في القدرة على تخزين البيانات (انظر الفصل‎ MU E 
ومزيدا‎ P hig الخامس).: ومن ناحية أخرىء هناك قناعة بأن "الأكثر هو أفضل" وسيقدم‎ 

من الدقة والصحه فى التحليل. 

وفي النظم المفتوحة مثل ا مشاريع العلمية الكبيرة. كتلك التي تقيس البيانات المناخية 
للإبلاغ عن الطقس ونمذجة الأرصاد الجوية: أو جمع البيانات الفلكية باستخدام مرقاب 
قوي» يكون التوجه نحو مجموعات بيانات أكبر بكثير. مع زيادة أحجام العينات عبر العديد 
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من المتغيرات ما أمكن ذلك. ولا يعني ذلك في علم الفلك. على سبيل المثال» مجرد جمع 
بيانات الضوء: ولكن أيضا البيانات من مختلف ألوان الطيف الكهرومغناطيسيء» وبدقة 
عالية لأكبر قدر ممكن. آما في حالة النظم المغلقةء مثل الفيسبوك أو شراء السلع من 
متجر على شبكة الإنترنت مثل أمازون أو إرسال رسائل البريد الإلكتروني: فمن ال ممكن 
تسجيل كافة التفاعلات والعمليات التي تحدثء بالإضافة إلى مستوى عدم التفاعل. às‏ 
هذه الحالات. هذا هو الواقع بطبيعة الحالء فموقع التواصل الاجتماعي الفيسبوك يقوم 
بتسجيل كل نشرء أو تسجيل لإعجابء أو رفع لصورة يتم تحميلهاء أو وصلة إلى موقع SST‏ 
أو رسالة مباشرةء أو لعبة لعبت» أو فترات الغياب» وما إلى ذلك لكل مستخدميه الذين 
ناهزوا المليار أو نحو ذلك. وبا مثلء» لا تسجّل شركة الأمازون فقط تفاصيل كل عملية شراء 
وا مشترين» ولكن أيضا جميع الروابط التي تم زيارتها وكل السلع التي تم استعراضها من 
خلال موقعهاء بالإضافة إلى كافة البنود التي تم وضعها في سلة التسوق وم يتم شراؤها. 
كما يتم تسجيل كافة رسائل البريد الإلكتروني من قبل الخادمات التي تستضيف صندوق 
البريد الإلكتروني للعميلء وتخزين كامل البريد الإلكتروني وجميع البيانات الوصفية المرتبطة 
به على سبيل امثال: الذين تم إرسال البريد الإلكتروني لهم أو استلامه منهم» والوقت / 
التاريخ» والموضوع. والملفات المرفقة. وحتى لو تم تحميل البريد الإلكتروني محلياً على جهاز 
المستخدم وتم حذفه فما زالت نسخة محفوظة منه على الخادم» هذا مع احتفاظ معظم 
امؤسسات والشركات بهذه اليانات لعدد من السنوات. 

وبالمثل بالنسبة للأشكال الأخرى من البيانات: فقد نمت البيانات ال مكانية بشكل كبير في 
السنوات الأخيرةء وذلك من خلال الاستشعار الآني عن بعد والصور الرادارية» إلى المشاريع 
الكبيرة مكتظة المصادر مثل مشروع خرائط (OpenStreetMap) 4-2 3zàll £ )15 —2Jl‏ 
وا مسارات المكانية الرقمية التي تم إنشاؤها بواسطة مستقبلات أنظمة تحديد المواقع 
اللععرافرة اللضمية ذاغل الأجهرة: .ويدف الضتفان الأؤلان إل أن كونا امل مكانناء 
بحيث تجمع التضاريس للكوكب الأرضي بأسره» ورسم خرائط البنية التحتية لدول بأكملها 
وتوفير مجموعات بيانات مشتركة ومرخصة للخرائط. فى حين يوفر المشروع الثالث القدرة 
على تتبُع وتعقب الحركة عبر الفضاء بمرور الوقت؛ وبناء مسارات الزمن - الفضاء التي يمكن 
تجميعها لتوفير نماذج الزمن - الفضاء للسلوك عبر مدن ومناطق بأكملها. وتمكن مجتمعة 
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من النمذجة ال مفصّلة للأماكن وطرق التنقلء والمقارنة الملسحية عبر الفضاء. واستهداف 
التسويق لمجتمعات معينة. وتقديم خدمات جديدة معتمدة على الموقع: والبيانات التي 
مكن الجمع بينها لاشتراكها في المرجعيات الطكانية لإنشاء قواعد بيانات وتطبيقات جديدة 
يمكن البحث مكانيا فيها (غلى سبيل اللثال. جمع البيانات حول منطقة لإنشاء ملفات 
تعريف للحي). 

وبالنظر إلى التقدم الحاصل في سعات التخزين (انظر الفصل الخامس).؛ يبدو أننا قد وصلنا 
إلى مرحلة بحيث يكون من الأسهل في كثير من الحالات تسجيل كل شيء. دون الحاجة إلى فرز 
البيانات» وتدقيقهاء وأخذ عينات منهاء وتسجيل ما يحتمل أنه مفيد منها فقط (ومن الذي 
يعرف ما يشت احتمال أنه مفيد فى المستقىل؟). وكما أشار (2012) :Zikopoulos et al.‏ »ا 
عجب أننا نغرق في البيانات, فإذا كنا نستطيع تتبع وتسجيل شيء ماء فإننا بالعادة نفعل». 
às‏ الواقع» JI Dumbill (2012: 7) jl‏ أن المبدأ الأساسي خلف البيانات الكبيرة هو «عندما 
daz a‏ احتفظ بكل شيء».. ويتجلى هذا بالاعتقاد بأنه كلما كان المزيد من البيانات متاحا: 
سنحت فرص أفضل لصنع رؤية أكثر صحة ونفاذا... وفرض العثور على «المنتجين» لنظرية 
John Seely Brown) 8.522‏ 24 | من 8 :2010 80111617 ). وعلى الرغم من US‏ تسهم 
إستراتيجية السعي نحو الشمولية بشكل كبير في طوفان البيانات» ويتمثل التحدي الأكبر في 
رؤية النمط الشامل والصورة الكبيرة من جملة التفاصيل وتمييز الغث من السمينء وإثارة 
مجموعة من الأسئلة الأخلاقية فيما يتعلق بنطاق البيانات التي يتم إنتاجها والاحتفاظ بها 
والاستخدامات التى يجري توظيفها فيها أو من ال ممكن توظيفها فيها (انظر الفصل العاشر). كما 
أنها تثر تساؤلات معرفية أساسية (2012 1101101). على سبيل ال مثال: وبالنظر إلى شموليتها: 
تساءل (2012) 211652116) عما إذا كانت تحليلات البيانات الكبيرة هى علم ما بعد الاختزال 
«((Post-reductivist)‏ وسيتم مناقشة هذه الأسئلة ممزيد من التفصيل فى الفصل الثامن. 


الدقة والتبويب/ الفهرسة :(Resolution and Indexicality)‏ 
بالإضافة إلى شمولية البيانات: أصبحت البيانات الكبيرة أكثر تناهيا في الدقة بكثير, 
وهاتان الخاصيتان يدفعان جميعا في الاتجاه نحو التبويب/ الفهرسة القوية (عنونة 
بوسم مميز وتحديد للهوية) )2005 (Dodge and Kitchin‏ وتعد صور الاستشعار 
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عن يُعد مثالاً على تعزيز الدقة, ففي أواخر الثمانينيات, كانت أعلى دقة للصور المتاحة 
لمعظم الباحثين غير الحكوميين عن سطح الأرض هي لتلك الصور التي التقطتها أقمار 
لاندسات (53166[111665 1,311015316) الصناعية. حيث تمثل كل نقطة ضوئية (بكسل) قطعه 
من الأرض تقدر ١ 1٠‏ متراء في حين أن الكثير من الصور المتاحة على جوجل إيرث 
ذات دقة تصل إلى 75,0 × ۲,۵١‏ مترء مما يتيح عرض الممزيد من التفاصيل وتحليلها. 
وبا لمثلء فيما يتعلق بمخرجات بيانات التعداد السكاني» فقد زاد علو درجة البيانات 
(à‏ العديد من الدول. ففى الحالة الأيرلندية» كان نشر بيانات التعداد حتى وقت 
قريب للدوائر الانتخابية ( ١,6٠9‏ منطقة بمتوسط ٠,١٠١١‏ نسمة ف كل منهاء حيث 
كانت الكثافة السكانية لكل دائرة انتخابية أعلى بكثير في المدن والبلدات وأقل في 
المناطق الريفية). وفي العام 27١١١‏ تم وضع بيانات التعداد بتوزيع جغرافي جديد سمي 
بالتجمعات الصغيرة. التى بلغ عددها /16,58. تمثل الوحدات الجديدة بالعادة بيانات من 
١0١0 - ۰‏ من الأسر (2009 .21 )»© 2هوء616©). وقد أتاحت التجمعات الصغيرة إجراء تحليل 
التعداد على مستوى الحي أو الشارع.؛ بدلا من مساحات شامتتعة jus‏ ومناطق ذات 
أعداد متساوية Ln‏ من السكان التي مكن مقارنتهاء مما يوفر «SÍ P‏ للتجمعات 
السكانية والاقتصاد الأيرلندي. وإمعانا في تحرّى المزيد من الدقةء يجمع العديد من 
وكلاء / سماسرة البيانات كميات كبيرة من البيانات المتعلقة بالأفراد والأسر التى تمكن 
الشركات من استهدافهم بشكل فردي بالسلع والخدمات (انظر الفصل الثاني). 
وقد صاحبت الزيادة في دقه البيانات: الزيادة في تحديد الهويات للأشخاص. وال منتجات. 
والمعاملات» والأقاليم بحيث أصبحت بياناتها أكثر تبويبا وفهرسة بطبيعتها (انظر الفصل 
الخامس). فعلى سبيل المثالء تحمل معظم السلع المعروضة للبيع في متاجر التجزئة الكبرى 
في الوقت الحاضر الرمز الشريطي (الباركود)» وهِيّز هذا الرمز المنتج» ولكن ليس كل وحدة 
منه على حدة - حبث تشترك كل زجاجات صابون شعر الرأس (الشاميو) من نفس العلامة 
التجارية (الماركة) في نفس الرمز - مما يعني أنه لا يمكن التمييز بينها بشكل فردي. 
وف اممقابلء تتميز زجاجة صابون شعر الرأس الموسومة بشريحة تحديد الهوية باستخدام 
«JA ,$ JS zo (Radio Frequency Identification Device- RFID) =l! UL 735‏ 
لأن لكل شريحة رمز فريد من الممكن قراءته عن بعد بواسطة جهاز استشعار الذبذبات 
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الراديوي. ونتيجة لذلك» مكن تتبع كل زجاجة من مكان صنعها من خلال سلسلة التوريد 
وحتى المتجر وسلة العميل» مما يوجد مسار للتدقيق المفصل. وبعبارة أخرىء فقد أصبح 
من الممكن تتبّع الأمور الفردية بدقة عبر الزمان والمكانء بما في ذلك أولئك الذين يعملون 
على نقل أشياء من مكان لآخر. وبالمثلء بالنسبة للمعلومات» وخاصة تلك التي في شكل 
رقميء حيث يتم تعريفها بشكل فريد من خلال رموز إدارة الحقوق الرقميةه Digital)‏ 
dhew des (Rights Management‏ المثالء بمكن تعيين معرفات الكائن الرقمي (10181621 
JI (Object Identifiers- DOIs‏ الأعمال الإبداعية المتوفرة على الانترنت (كالتقارير 
ا لمجلات» الصورء الصوت» وملفات الفيديو)ء فمعرفات الكائن الرقمي هي محدد هوية دائم 
مرشدط بالسانات diog‏ مثل عنوان (Universal Resource Locator- URL) &5;3VI‏ 
الذي يشير إلى موقع الملف. ويعزز استخدام اممعرّفات الفريدة العلائقية والقدرة على ربط 
وضم البيانات معاء كما يوفر وسائل عملية لفرز ورصد ومطابقة وتمثيل الكائنات Lyon)‏ 
Dodge and Kitchin 2005; Graham 2005‏ ;2003؛ انظر أيضاً الفصل العاشر ). 


:(Relationality) 4435XsJI 
تتمثل العلائقية بمدى القدرة على ضم مجموعات بيانات مختلفة بروابط بعضها مع‎ 
بعض وكيف ممكن اسستخدام هذه الروابط للإجابة عن أسئلة جديدة. فالعلائقية هي‎ 
في صميم قواعد البيانات العلائقية (انظر الفصلين الثاني والخامس). وهي القدرة على‎ 
إنشاء بيانات غاية في العلائقية التي تدفع بسوق البيانات الواسع وأرباح وكلاء البيانات‎ 
وشركات ال ملفات التعريفية (انظر الفصل الثاني). إن الدرجة العالية من العلائقية هي‎ 
ما يجعل التعداد السكانىي مفيدا جدا لفهم التركيبة السكانية لأى أمةء وكيف تتغير عبر‎ 
الزمان وال مكان. وتختلف دراسات البيانات الصغيرة فى مدى علائقيتهاء " ميل تلك التى‎ 
تنطوي على البيانات المنظمة لدرجات أعلى من الترابط من تلك البيانات غير المنظمة.‎ 
وهذا يستدعي القول إنه ينبغي وجود شكل من أشكال العلائقية بين البيانات لاستخلاص‎ 

التفسيرات والاستنتاجات الشاملة منها. 
وعلى الرغم من أن البيانات الكبيرة لا تستخدم غالبا بنية قاعدة بيانات علائقية 
(انظر الفصل الخامس). فإن ميزة أساسية في طبيعتها هي العلائقية القوية. وكما فصّل 
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Crawford (2011: 2(‏ 2110 6070 فإن «البيانات الكبيرة مترابطة بشكل أساسيء وتنبع 
قمتها من الأنماط التي يمكن استخلاصها من خلال صنع روابط بين أجزاء من «bU UI‏ 
عن فرد. أو أفراد على علاقة بآخرينء أو مجموعات من الناسء أو ببساطة عن هيكل 
تنظيم المعلومات نفسها». إلا أنها وخلافا لقواعد البيانات العلائقية. فهي تتقن بالتساوي 
التعامل مع البيانات غير الرقمية (الرمزية)»؛ والبيانات غير المنظمة كما البيانات المنظمة: 
والربط بين النوعين معا وتعظيم القيمة المستفادة من التقاطعات بينها. ومن ثم: أصبح 
من الممكن الربط بين مجموعات متنوعة من البيانات - الشخصية. والعملية: والتفاعلية 
والاجتماعية. والمالية. والمكانية: والزمنية» ...إلخ - وتحليلها على أساس فردي وجماعي 
للعلاقات والأنماط. 

وقد ثبت جلياء كمثال على قوة هذه العلائقية, الاستخدام المكثف للبيانات الكبيرة في 
الحملات الانتخابية للرئيس الأمريكي أوباما في العام 8١٠٠م‏ و1١1١7م.‏ فعلى النحو الذي 
ssenberg (2012) 4La$‏ سعى فريق اوباما لتحديد وتتبع جميع جوانب حملاتهم 
الانتخابية في ٠٠١8‏ م و١١١5‏ م. ووضع سلسلة كاملة من المقاييس التي تم تسجيلها 
والتنقيب فيها بشكل مستمر للحصول على معلوماتء وأنماط واتجاهات مفيدة. واشتمل 
ذلك على مراقبة صارمة للإجراءات الخاصة بهم مثل وضع الإعلانات عبر وسائل الإعلام 
امختلفة: وإجراء حملات بريد الإلكترونية» والاتصال الهاتفي بالناخبين اممحتملين» وطرق 
الأبواب وفرز الاصوات الانتخابية للمناطق» وتنظيم الاجتماعات واطمسيرات» وتتبع الذين 
كانوا قد تحدثوا إليهم وماذا قالوا أو ما التزموا به. وقد عززوا هذه ال معلومات بمنات 
التجارب العشوائية واسعة النطاق المصمّمة لاختبار فعالية مختلف طرق إقناع الناس على 
التصويت لصالح أوباما أو التبرع بالأموال لحملته. وجمع فريق أوباما بين جميع ال معلومات 
التي نتجت فيما تعلق بالناخبين وبيانات التسجيلء والتعداد السكانيء والبيانات الحكومية 
الآخرى. ومسوحات الاقتراع» وبيانات جرى شراؤها من طيف واسع من الموردينء بما في 
ذلك وسطء البيانات ووكالات التصنيف الائتماني» وشركات التلفاز الخطي (Cable TV)‏ 
وكانت النتيجة مجموعة من قواعد البيانات الضخمة عن كل الناخبين في البلاد تتكون مما 
لا يقل عن ثمانين obo s os‏ (2012 0101162©): وأكثر من ذلكء أنها ترط بالخصائص 
الدمموغرافية للناخبين المحتملينء وتاريخ انتخابهم» وكل حالة من حالات تواصلهم مع 
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حملة آوباما وردود أفعالهم» والتاريخ الاجتماعى والاقتصاديء وأنماط سلوكهم واستهلاكهم 
ووجهات النظر والآراء التي تم الإعراب عنهاء مع تحديث قواعد البيانات يومياً خلال 
الحملة بكل بيانات جديدة يجري إنتاجها أو شراؤها. إما في الحالات التى لا يعرف فيها 
محللو أوباما الانتماء السياسي للناخبء ولا يمكنهم فيها الوصول إلى ذلك من خلال الاتصال 
المباشر معه. فإنهم يوظفون خوارزمية متطورة تستخده المتغيرات التي بحوزتهم عن 
gal b yari‏ عن التصويت ال محتمل المفضل له (2012 155615616). وكانت النتيجة 
مليارات من أجزاء البيانات المترابطة والتى استخدمت للتعريف بالناخبين بشكل فردي؛ 
وتقييم مدى احتمالية قيامهم بالتصويت والكيفية التي يصوتون بهاء والكيفية التي قد 
يستجيبون بها لمختلف السياسات والقصص. لقد أنشأً الترابط بين البيانات في حملة 
أوباما x—lhas (Crampton et al. 2012) ale alhol L‏ «تأثير تضخيم المعلومات» 
(Information Aplifier Effect)‏ حيث مجموع السيانات أكثر من الأجزاء. 


السرعة (Velocity)‏ : 
هناك فرق جوهري بين البيانات الصغيرة والبيانات الكبيرة يتمثل في الطبيعة الديناميكية 
لإنتاج البيانات. فالبيانات الصغيرة تتكون عادة من الدراسات التى تكون مؤطرة بقالب 
جامد من حيث الزمان والمكان. وحتى في الدراسات المطؤلة» يتم التقاط البيانات في أوقات 
متفرقة ذات فاصل زمنى (على سبيل الم مثال» كل بضعة أشهر أو سنوات). فعلى سبيل المثال؛ 
يتم إجراء التعدادات السكانية بشكل عام كل خمس أو عشر سنوات» وف المقابل يتم 
إنشاء البيانات الكبيرة على أسس أكثر استمرارية بكثيرء وف كثير من الحالات بشكل آن أو 
لحظي ويشكل مباشر بالتقارب من الوقت الحقيقي للوقوع as . (Real-Time)‏ عن 
قدر ضئيل ومتفرق من البيانات» التي تجمع أو تعالج بمشقة: فإن البيانات الكبيرة تتدفق 
بسرعة. ولذلك كان هناك انتقال في التعامل من المعالجة بالدفعات (Batch processi¬g)‏ 
إلى السانات المتدفقةه )2012 Amb yas .(Streaming Data) (Zikopoulos et al.‏ 
يسهم هذا في مسألة كبر حجم البيانات من خلال إنتاج بيانات بسرعة أكبر.ء ومن ناحية 
أخرىء فهو يجعل كامل دورة البيانات أكثر ديناميكية بكثيرء ويبرز قضايا كيفية إدارة نظام 

السيانات المتغير باستمرار. 
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وتنبع السرعة من التكرار المستمر لتسجيل ال مشاهدات مع مرور الوقت و/أو تغير 
(Jacobs 2009) 55.‏ مع كون العديد من الأنظمة في وضع التشغيل الدائم باستمرار 
Law les (Dodge and Kitchin 2005)‏ امثال. تسجل المواقع الإلكترونية بيانات كافة 
الزيارات التي مت للموقع والأنشطة التى قام بها الزائر خلال تصفحه على الموقع؛ كما 
تقوم المعدات الطبية بمراقبة العلامات الحيوية باستمرار وتسجّل الكيفية التي يستجيب 
بها الجسم للعلاج وتطلق إنذارا في حال تجاوزت هذه العلامات حدّ معين؛ وتتعقب شركات 
الهاتف ال محمول موقع» وهوية. وطبيعة استخدام الأجهزة الموصولة على شبكاتها كل بضع 
ثوان؛ وبامثل ترصد شبكات استشعار الطقس مؤشرات الغلاف الجوي كل بضع دقائق 
وترسل نتائجها إلى قاعدة بيانات مركزية لإدراجها في الاستطلاعات الجوية؛ ويسجل جهاز 
(Transponder) sgl II OLLY leial‏ على طول طرق اطدينة البرية والسكك 
الحديدية هوية الحافلات والقطارات التي تمر مما يتيح لسلطة النقل العام معرفة أماكن 
مركباتها فق آي وقت» واحتساب الوقت المقدّر للوضول في محظات التوقف ال مختلفة؛ كما 
تراقب متاجر التجزئة مبيعات الاف ال منتجات ا مختلفة للآلاف من العملاءء حيث تستخدم 
البيانات لمعرفة أوقات إعادة تعبئة الرفوف وطلى دفعات جديدة من الموردين؛ ويتواصل 
الناس بعضهم مع بعض من خلال مواقع وسائل التواصل الاجتماعي في سيل لا ينتهي 
من التبادلات والعلاقات المبينية ال متشابكة؛ ويرصد اطرقاب (1©1©56026) باستمرار السماء 
لقياس التقلبات في موجات الراديو من أجل فهم أفضل لطبيعة الكون» ففي كل هذه 
الحالات» هناك تيار مستمر من البيانات التي تتطلب إدارة وتحليلا مستمرا. 

ويشكل نقل وإدارة كميات كبيرة من البيانات المنتجة باستمرار تحديا تقنيا بسبب 
التحديات الناشئة عن محدودية قدرة سعة التخزين مما يوجد اختناقات بشكل سريع 
في حركة مرور وتبادل البيانات. على سبيل المثال: وكما أن فيديوهات موقع اليوتيوب 
(©11115املآ) قد تتوقف أو يتأخر عرضها بسبب كون سعة قناة الاتصال بالإنترنت ليست 
كافية لتواكب سرعة تدفق البيانات المطلوبء فإن الآثر نفسه مكن أن يقع ف حالة جمع 
ومعالجة السانات. حيث تكون الأنظمة عاجزة عن مواكبة تدفق السانات. وتشمل حلول 
هذه المشكلة زبادة سعة قناة الاتصال. وتوظيف تقنيات فرز وضغط السيانات مما بقلل 
من حجمها ومن ثم وقت معالجتها. وتحسين كفاءة خوارزميات ال معالجة وتقنيات إدارة 
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البيانات. كما ممثل تحليل سيل البيانات المتدفقة asl Ld‏ لآن النظام لا يسكن في أي 
لحظة وعند أي نقطة. كما في حالات الأسواق المالية. حيث يمكن أن يكون تحليل الصفقات 
لمايكرو ثانية من الزمن 3S‏ للغاية. وهناء تستخدم خوارزميات معقّدة. إلى جانب العرض 
المرئي للبيانات الديناميكية وهي في حالة تغير مستمرء لتتبع وتقييم النظام. 


:)Variety) ¢ gul 
قد تختلف البيانات الصغيرة والبيانات الكبيرة في طبيعتهاء كونها منظمة» أو غير منظمة‎ 
أو شبه منظمة. وتتألف من الأرقام: النصوصء الصورء الفيديوء وغيرها من أنواع البيانات‎ 
الأخرى. إلا أن هذه الأنواع ا مختلفة من البيانات يرجح أن تكون ف البيانات الكبيرة أكثر‎ 
قابلية للجمع والربط بينهاء وإمكانية وصل البيانات المنظمة بالبيانات غير المنظمة. فعلى‎ 
سبيل المثال» تتألف نشرات الفيسبوك من النصوص التي ترتبط في الغالت بصوز أو ملفات‎ 
فيديو آو غيرها من اممواقع» وهي تجتذب تعليقات مستخدمي الفيسبوك الآخرين؛ كما‎ 
قد تجمع شركة ما بين البيانات المالية المتعلقة بالمبيعات واستطلاعات العملاء التي تعبر‎ 
عن مدى ثقتهم بالمنتج. وفي المقابل تكون البيانات الصغيرة أكثر انفصالا وترتبط» على‎ 
من خلال مفاتيح تعريفية وحقول بيانات مشتركة. ويتمثل السبق الأساسي‎ JU JS 
بالنسبة للبيانات الكبيرة في كيفية اختلافها عن الأشكال التى سبقتها لإدارة البيانات الرقمية:‎ 
والتى كانت احترافية للغاية في معالجة وتخزين البيانات الرقمية باستخدام قواعد البيانات‎ 
العلائقيةء مما مكن من إجراء مختلف أنواع التحليل الإحصان. إلا أنها كانت أضعف بكثر‎ 
في التعامل مع نماذج البيانات الغير رقمية. عدا عن مجرد تخزينها في ملفات مجرذة آو‎ 
Data Center Alliance (2012: 7) مضغوطة. وكما لاحظ اتحاد مراكز السانات المفتوحة‎ 
بأنه في السابق كان يجري تجاهل البيانات غير المنظمة:» أو في أحسن الأحوالء استخدامها‎ 
فإن التقدم الحاصل في الحوسبة الموزعة. وتصميم‎ US gog بشكل يفتقر إلى الكفاءة.‎ 
قواعد البيانات باستخدام هياكل عوضا عن لغات الاستعلام الهيكلية (:7050[1) (انظر‎ 
الفصل الخامس). والتنقيب فق البيانات وتقنيات اكتشاف اللمعرفة (انظر الفصل السادس)ء‎ 
قد زادت بشكل كبير القدرة على إدارة ومعالجة واستخراج المعلومات من البيانات غير‎ 
المنظمة. وفى الواقع. يجري على نطاق واسع تداول أن ما يقارب تمانين في المائة من جميع‎ 
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السانات الكبيرة ھی غير منظمة بطسيعتهاء وكما آبان )2011( 32S (Grimes‏ أصبح BUS‏ 
الرقم مسلّما به مع قليل من الإثبات. 


المرونة :(Flexibility)‏ 
بكون تصميم البحث وإدارة البيانات» مع مشاريع البيانات الصغيرةء غير مرن نسبيا 
بمجرد بدء العمل ال ميداني والتحليلء وذلك بالنظر إلى الخدمات اللوجستيه» والتكاليف» 
والحاجة إلى التمثيل قي عينه صغيرة الحجم. فعلى سبيل المتالء فإنه من الضروري على كل 
شخص تم جمع بيانات التعداد له تعبئة النموذج ذاته للتأكد من إمكانية قابلية مقارنة 
البيانات عبر كافة السكان. وبمجرد طباعة النماذج. لا يممكن إضافة حقول بيانات جديدةء 
مما يعني ثبات البيانات ال ممكن استخراجها من هذه giel‏ وبامثل تميل قواعد السيانات 
العلائقية التي تحفظ بها البيانات إلى أن تكون قالبا ثابتا ومحدودة النظاق. وعلى نحو 
مماثل» يكون تصميم البحث عادةء ف التجارب العلمية والدراسات البيئية» غير مرن مجرد 
بدئهاء وذلك بهدف تمكين إجراء عمليات المقارنة والتكرار. أما في الدراسات التي تعتمد 
المقابلات أو الأنشطة الاجتماعية. فمن ال ممكن للباحثء على الرغم من ذلكء أن يكون أكثر 
مرونة في النهج المتبع؛ ils‏ يكون لديه نموذج ALANI cya S‏ وإمكانية التكيف مع الأوضاع 
المستجدة. وممكن أن يكون ترميز وإدارة وتحليل هذه البيانات LA lisa‏ ولكن هذا يعود 

جزئيا إلى محدودية حجم ونطاق مجموعة البيانات. 

في المقابلء تمّ تصميم نظم البيانات الكبيرة لتكون مرنة بطبيعتهاء بحيث تحمل 
سمات قابلية الاستطالة والتفرع (ممكن إضافة حقول بيانات جديدة بسهولة) وقابلية 
التوسع (ممكن التوسع بسرعة) بغض النظر .(Marz and Warren 2012) exJ! ge‏ 
ويعني استخدام قواعد البيانات غير الهيكلية للاستعلام (805001) إمكانية إدارة البيانات 
ا متغيرة بسرعة عالية: والتكيف مع حقول البيانات الجديدة (انظر الفصل الخامس)» 
وهذا يعني أنه من الممكن التكيّف مع إنتاج البيانات على أسس تدويرية» وأداء الاختبار 
على التكيف. فعلى سبيل المثالء تقوم شركات جوجلء والفيسبوكء. ومنصات أخرى 
على الإنترنت بتعديل تصاميمهاء وجمع بيانات حول كيفيه استجابه اطمستخدمين لهذه 
التغييرات على سبيل ال مثالء مراقبة الزيارات العابرة للموقع» وتحليل النتائج واستخدامها 
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لتقديم مزيد من التعديلات المحسنة للتصميم بغية تشجيع إجراءات وردود معينة 
بشكل مستمر. ولأن أعداد الأشخاص الذين يستخدمون هذه ال مواقع هائلة. وأحجام 
العينات الخاصة بهم كبيرة Te‏ فهذا يعني أن بإمكانهم إجراء التغييرات دون الخوف 
من فقدان التمشل. على سبيال المثال: وبالعودة إلى حملة باراك أوباما الانتخابية: 
فقد أجرى فريق حملته تجارب متتالية عن مدى فعالية التعديلات المحسنة للوقع 
الحملة (823131021112.60112) لزيادة المشاركة. والعمل التطوعي» والتترعات. فأحد 
الاختبارات قيّم اثار التغيير على زر «اشترك» إلى «مزيد من المعلومات»»: و «انضم إلينا 
الان». و«اشترك الان»: وأصبح من الواضح على مدى ثلانمائة ألف زيارة أن استخدام زر 
«انضم إلينا الآن» قد أدى إلى عشرين ف امائة زيادة في الزائرين المقبلين على التسجيل 
قي الموقع (2012 155620618). 

فمثّل هذه المواقع الكبيزةالحجم ينبغى أن تكؤن أيضاً قابلةاللتوسع والتطوير: 
وقادرة على التعامل مع الطفرات الناشئة في طلب وإنتاج البيانات» حيث يتسبب مقدار 
حركة مرور البيانات في انهيار قاعدة البيانات العلائقية التقليدية العاملة على خادم 
واحد. فعلى سبيل المثال» يمكن أن يزداد عدد التغريدات التي يتعامل معها تطبيق 
التواصل الاجتماعي تويتر بشكل ملحوظء مع عشرات الالاف من التغريدات التي يجري 
نشرها كل بضع ثوان أثناء الأحداث الكبيرة» مثل حفل افتتاح الألعاب الأوطبية أو خلال 
المباراة النهائية. وكان الحل هو تركيب أنظمة عتاد تتألف من أجزاء موزعة بحيث تخزّن 
البيانات في قواعد بيانات مقسّمة عبر العديد من الخوادم: مما يمكن من توسيع نطاق 
التخزين بحسب الحاجة. وعلاوة على ذلك ففي بعض الأنظمةء مثل تويتر يمكن تعيين 
المرونة من قبل اللمستخدمين لتحديد ما إذا كانت تشمل البيانات آم لا. على سبيل «JULI‏ 
يقرر المستخدمون في العديد من تطبيقات وسائل التواصل الاجتماعي وامتنقلة gl»!‏ 
أو عدم إدراج مواقعهم» وكذلك البيانات التعريفية الرئيسية الأخرى المتعلقة بالهوية 
.(Gorman 2013)‏ 
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الخلاصة: 

البيانات الكبيرة هى ظاهرة حديثة: وبالنظر إلى التطبيق والانتشار المتسارعين لهاء فقد 
برزت نقاشات مستمرة حول ما چک البيانات الكبيرة والخصائص امرتبطة بها. ود 
بعض التعاريفء مثل تلك التي تنص على أن البيانات الكبيرة هي أي de gamo‏ انات 
كبيرة fis‏ بالقدر الذي لا å lajas azo OS‏ جدول بيانات E.‏ أو على جهاز واحد 
(Strom 2012)‏ مبتذلة للغاية وغير مفيدة.» حيث تخفض مستوى مفهوه البيانات الكبيرة 
إلى خاصية الحجم فقط. لقد أصبح من الواضح أن لدى البيانات الكبيرة عدد من الخصائص 
الملازمة لها والتي تجعلها مختلفة نوعبا عن الأشكال السابقة من البيانات» وتم قي هذا 
الفصل مناقشة الخصائص الأساسية السبعة للبيانات الكبيرة: الحجمء والسرعةء والتنوع 
والشمولء والدقة / الفهرسة. والعلائقية: وال مرونة / قابلية التوسع التي تميزها عن البيانات 
الصغيرة (انظر الجدول .)١-7‏ 


فهذه هي دورة المستوى الأول فيما يتعلق بتقديم تقييم توصيفي لطبيعة البيانات 
الكبيرة. وهناك حاجة إلى مزيد من العمل لتقييم البيانات الكبيرة الناتجة عن مصادر 
متعددة لتحديد ما إذا كان هناك أصناف de gia‏ في طبيعة البيانات الكبيرة. فعلى سبيل 
JELI‏ قد تحمل بعض البيانات خفسا أورستا من هذه الخصائص..ولكنها لا توف أو 
ضعيفة في واحدة أو اثنتين» وقد تفتقر مجموعة بيانات إلى التنوع (منظمة بشكل كبير). أو 
الحجم (صغيرةء ولكن شاملة مع حجم العينة ن = الجميع): أو قليلة v‏ (يتم إنشاء 
البيانات بانتظام ولكن في كل شهر عوضا أن تكون بشكل مستمر)ء أو تفتقر إلى الفهرسة 
(كونها مجهولة ال مصدر أو مجمعة). مع حملها للخصائص الأخرى على سبيل المثال. فمن 
الواضح أن مثل هذه البيانات ليست بيانات صغيرة كما هو مبين في الفصل الثاني ولكنها 
في ذات الوقت ليست بيانات كبيرة كما تفهم بمعناها الضيق الذي يصفها بكل الخصائص 
السبع» ولكن هكن اعتبارها على الرغم من ذلك شكلا من أشكل البيانات الكبيرة. وبعبارة 
T‏ هناك حاجةه لإنتاج تصنيف للبيانات الكبيرة قائم على آدلة تجريبية قوية مع أمثلة 
الحالات التى من شأنها أن تساعدنا على التفكير بصورة أكبر في طبيعة هذه البيانات. 
ويحتاج هذا إلى أن يكون مصحوبا بدراسة للخصائص الأخرى» مثل نوعية البيانات وصحتها 
ودقتهاء ومنشئها (انظر الفصل التاسع). 
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كما تثير الخصائص السبع للبيانات الكبيرة تساؤلات بشأن الآثار المترتبة على طوفان 
مثل هذه البيانات: وما الذي يعنيه القدرة على الوصول إلى بيانات كبيرة جداء وشاملة, 
ومتغيرة» ودقيقة. ومفهرسه. ومتنوعة: dyag Aeg‏ وقابلة للتوسع بالنسبة للمجتمع 
والحكومة ورجال الأعمال؟ وإلى أي مدى يمكن أن توفر هذه البيانات رؤى ثاقبة عن 
حالة الإنسان أو المساعدة على تناول بعض القضايا الاجتماعية: والسياسية» والاقتصادية: 
والبيئية الأكثر إلحاحا والتى تواجه كوكب الأرض؟ أوء بدلا من خدمة الصالح العام: فهل 
ستستخدم هذه البيانات لمزيد من خدمة ال مصالح الخاصة في الغالب؟ أو خدمة مصالح 
الدولة؟ وكيف سوف تغير هذه البيانات في نظرية المعرفة العلمية في جميع المجالات 
(الأداب والعلوم الإنسانية» والعلوم الاجتماعية: والعلوم الفيزيائية والحياتية: والهندسة)؟ 
فالفصل السابع والثامن والعاشر ستناقش هذه القضايا بالتفصيل: وتقدم التفكير النقدي 
JY‏ وعواقب البيانات الكبيرة. 
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ممكنات السيانات الكبيرة ومصادرها 


برز النمو السريع للبيانات الكبيرة نتيجة التطور المتزامن معه لعدد من التقنيات المساعدة, 
والبنى التحتية: والأساليب وال ممارسات. وتضمينها بشكل سريع ف الأعمال اليوميةء وا ممارسات» 
والمساحات الاجتماعية. وتضمنت هذه البنية التحتية المعرفية الجديدة إطلاق طيف واسع 
من مجموعه متنوعة من Dlui‏ ال معلومات والاتصالات. وخاصة خدمة الإنترنت الثابتة 
والمتنقلة عبر الهاتف المحمول؛ وإدخال البرمجيات في جميع الكائنات» والآلات والأنظمة: ناقلة 
إيّاها من «الغباء» إلى «الذكاء». فضلا عن إنشاء أجهزة وأنظمة رقمية بحتة بالكامل؛ وتطوير 
الحوسبة الشمولية الواسعة الانتشار والقدرة على الوصول إلى الشبكات والحوسبه في العديد 
من البيئات» وعلى ذات خطى هذا التحرك؛ التقدم في تصميم قواعد البيانات ونظم إدارة 
المعلومات؛ وعروض التخزين الموزع. والتخزين الأبدي للبيانات بأسعار معقولة؛ والأشكال 
الجديدة من تحليلات البيانات ا مصممة للتعامل مع وفرة البيانات بدلا من ندرتها. 

وإضافة إلى تمكين الوصول والمشاركة والتخزين للبيانات» تعد البنية التحتية وا معرفية 
الجديدة في الغالب الوسيلة التي يتم إنتاج الكثير من البيانات الكبيرة منها. ففي الواقع, 
وبلا شك أن الحالة في وقتنا الحاضر تتمثل في أننا نعيش في مجتمعات تستخدم على نحو 
متزايد تقنيات البيانات المكثفة والمنتجة لها وتنتظم على أساسها. كما أصبحت الممارسات 
الشخصية فى الاتصالء والاستهلاكء والإنتاج» والسفرء والحياة المنزلية: أكثر فأكثر تتوسّطها 
الأجهزة الرقمية التي تنتج الكثير من البيانات المستنفذة القيّمة. وعلاوة على eX «AUS‏ 
الآن مراقبة وتنظيم الأماكن التي نعيش فيها على نحو متزايد بمجاميع كثيفة من التقنيات 
والبنى التحتية المدعمة بالبيانات. مثل أنظمة المرور وإدارة المباني. ونظم المراقبة والشرطة. 
وقواعد البيانات الحكومية: وإدارة العملاء وسلاسل الدعم اللوجستية: والأنظمة المالية 
ونظم المدفوعات. وستناقش العوامل المساعدة ومصادر البيانات الكبيرة بالتفصيل فى هذا 
الفصل. 
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العوامل المساعدة للسانات الكسيرة: 

تعد البيانات الكبيرة مُحصلة للتطور والتقارب بين مجموعة متقدمة من التقنيات في 
مجال الحوسبة منذ نهاية الحرب العاطية الثانية. ويشمل ذلك إنتاج أجهزة الحاسب 
امركزية في الخمسينيات والستينيات؛ وشبكات الإنترنت الوليدة في السبعينيات والثمانينيات 
التي ربطت الحاسبات بعضها ببعض؛ والانتشار الواسع النطاق للحاسبات الشخصية في 
الثمانينيات والتسعينيات؛ والنمو الهائل للإنترنت ق التسعينيات» وتطوير الصناعات القائمة 
على الويب» جنباً إلى جنب مع النمو الهائل في الهواتف النقالة والأجهزة الرقمية مثل أجهزة 
الألعاب والكاميرات الرقمية؛ وتطوير الحوسبة dolo JI‏ والموزعة. والنقالة» وتقنيات 
الإصدار الثاني لشبكة الويب (2.0 1865) في بدايات الألفية الثانية؛ وتفشي الحوسبة الشمولية 
واسعة الانتشار )Ubiguitous and Pervasive Computing)‏ خلال هذا العقد. وخلال 
هذه الفترة وقع اعدد من اممؤثزات التحويليةء فزادت القدرة الحاسوبية أضعافاً مضاعفة, 
وتم ربظ الأجهزة معاء وتداخلت الأنظمة الرقمية بازدياد متعاظم فى شئون الحياة اليومية 
وعملياتهاء وأصبحت البيانات أكثر من أي ؤقت مضى مفهرسة وقابلة للقراءة الآلية» كما 
توسعت أنظمة تخزين السانات وأصحت موزعة. 


الحوسبة (2011212116261011)): 

بينما قدّمت الحواسيب الرقمية المركزية الأولية في الخمسينيات والستينيات قدرة 
حاسوبية أكثر كفاءة من تلك التي عند البشر والأجهزة التناظرية التي استخدموها (مثل 
المعداد: والآلات الحاسسة ال ميكانيكية؛ والآلات الحاسبة بالبطاقات المثقوبة: وأجهزة 
الحاسب التناظرية: إلخ). إلا أن قوة المعالجة لها كانت محدودةء ومن ثم كانت أنواع 
العمليات التي مكن آداؤها مقيدة: وعلاوة على ذلك كانت تلك الحواسيب كبيرة الحجم 
ومكلفة. على سبيل امثالء: كان بإمكان Electronic Numerical) JL 5l c ub‏ 
P sl (Integrator Analyser and Computer- ENIAC‏ 3 منتصف الأربعينيات: 
أداء خمسة آلاف عملية جمع وطرح ف الثانية» ولكن اقتصرت ذاكرته الرئيسية عالية 
السرعة على عشرين كلمة (أي ثمانين بايت): لآلة تزن ثلاثين طنا وتحتوی ۱۸,۰۰۰ 
أننون فراغيء و١٠0٠,0١‏ مرخلء ومئات الآلاف من المقاومات والمكثفات والمحاثات. 
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وباستخدام pöl‏ كيلوواط من الطاقه الكهربائية (2004 ندnزةN).‏ وق العام ANITO‏ 
توقع Gordon Moore‏ من إنتل بآن يتضاعف عدد الترانزستورات ف الدواتر المتكاملة 
كل ثمانية عشر شهرا في العقد المقبل ذلك الحين. مما يزيد بشكل كبير القدرة الحاسوبية 
(وهو ما أصبح يعرف لاحقا باسم قانون مور). وقد أشنت هذا التوقع بصيرة نافدة حيث 
تم إدخال تحسينات تقنية على مكونات وتصميم أجيدة الحاسس (من خلال الانتقال 
من الأنابيب الفراغية إلى التراننستورات إلى الدوائر المتكاملة إلى امعالجات TCR‏ 
(dies‏ القوة الحسابية فيما يقرب من الخمسين ف اماتئة TE‏ بين عامي ١15٠‏ م 
٠٠م‏ (2002 1101:0113115). وإلى جانب هذا النموء انخفضت تكلفتها بشكل كبير 
is‏ تشير إحدى التقديرات بانخفاض في تكلفة الحساب ناهز أضعاف الكوادريليون 
)٠١ 0.6.0... )‏ خلال القرن العشرين (2003 624). 
استمرت مثل هذه الزيادات الهائلة في القدرة الحاسوبية والانخفاضات الكبيرة في 
التكلفة في الألفية الجديدة؛ ولكن الأهم من ذلك أنها أصبحت متنقلة على نطاق واسع 
مع انتشار مكثف للأجهزة الحاسوبية المحمولة مثل أجهزة الحاسب ال محمولء والأجهزة 
اللوحية والهواتف ASI‏ وأجهزة الملاحة المرتبطة بالأقمار الصناعية (SatNav)‏ 1&5 
وتعادل قوة المعالجة للهاتف الذى المتوسط "عشرة أضعاف قوة جهاز الحاسب ال مركزي 
كراي1- (21877-1)) الذي تم تشغيله في مختيرات لوس الاموس الوطنية في عام 1976م " 
(Townsend 2013: xiii)‏ مع استخدامها جزء من قوة معالجتها. حيث تمتلك قدرات 
حاسوبية» وتخزينية: وتطبيقات أكثر من العديد من أجهزة الحاسب الشخصية منذ 
عقد واحد فقط من الزمن» وهي أيضا تشغل جزء بسيط في حجم العتاد المستخدم. 
«JU Lacu Le‏ لدى العديد من الهواتف الذكية معالجا مصغرا بسرعة Y, - ١,0‏ 
غىغاهرتز و١۱‏ - ”77 غيغابايت من الذاكرة الرئيسية. Sq‏ هذه القوة في امعالجة 
وسعة الذاكرة من معالجة كميات كبيرة lae‏ من البيانات بسرعة. ليتم تخزينها la‏ 
لأنها متصلة شىكىا ومشتركك. 
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: (Networking) J& jl 
بذات القدر من الأهمية للنمو الكبير في القوة الحسابية معالجة البيانات الرقمية كان‎ 
الربط بين الحاسبات بعضها مع بعض والذي سهل نقل وتبادل البيانات فيما بينها. وقد‎ 
وقع أول اتصال شبكي بين جهازي حاسب عبر شبكة الإنترنت في نوفمبر عام 19719 م: وقد تم‎ 
الربط بين نقطة في جامعة كاليفورنيا في لوس أنجيلوس (001.4]) ونقطة أخرى في جامعة‎ 
3 YY نقطة فى يناير ١/191م, إلى‎ ١١ ستانفورد (1995 53115). ثم نمت الشبكة ببطء. من‎ 
واقتصرت حينها على‎ eNA في يونيو 191/6م: و١۱۱ بحلول مارس‎ 7 I آبریل ۱۹۷۲م‎ 
ARPA) (Hart et al. 1992; 0 Neil) يعlدلا متعاقدي وكالة مشاريع البحوث اممتطورة‎ 
وتعمل شبكة الإنترنت من خلال تقطيع البيانات والتعليمات في حزم متساوية‎ .25 
الحجم ونشرها عبر النظام» مع عنونة كل حزمة بمعرّف وعنوان ال مرسل إليه المطلوب» ثم‎ 
تمرّر كل حزمة من نقطة اتصال إلى أخرى إلى أن تصل إلى الوجهة المقصودة حيث يتم إعادة‎ 
تجميعها هناك. ولتمكين اتضال الأجهزة والشبكات التي تعمل على سرعات مختلفة على‎ 
مدار الساعة وتستخدم حَرَْمَاً مختلفة الحجم؛ اعتمدت مجموعة معيار (بروتوكول) الشبكة‎ 
١91/7 تې سي بى / اي بي (1602/185) (معيار التحكم بالإرسال / بروتوكول الإنترنت) في عام‎ 
ولا يزال هذا المعيار يستخدم حتى يومنا هذا. كما يؤكد هذا ال معيار على‎ (O'Neill 1995) 
حيادية الشبكة» حيث يتم التعامل مع كافة البيانات على قدم المساواة ودون تمييز بينها أو‎ 

تفاضل في التكلفة (2011 071آ). 

وبحلول أواخر السبعينيات: تمّ إنشاء الشبكات المحلية الداخلية: كما تم إنشاء الشبكات 
الأخرى دوليا وتم ربطها بشبكة الإنترنت الوليدة إضافة إلى شبكات الهواة المستقلين 
والشركات. كما أصبح من ال ممكن إرسال حزم البيانات عبر الأقمار الصناعية. وبالإضافة إلى 
نقل البيانات وامملفات» تم إنشاء البريد الإلكتروني واللوحات الإعلانية )1998 (Kitchin‏ 
وخلال الثمانينيات» نمت البنية التحتيةء مع لاعبين جدد من المؤسسات والشركات» جنبا إلى 
جنب مع تطور شبكات الإنترانت الداخلية (الشبكات الخاصة). وف عام ۱۹۹۲م اخترع تيم 
»55 5 لي 45.2J] «227 (8 (CERN) 55» 5» (Tim Berners-Lee)‏ ]4,57 (الويب)؛ 
وقدّم وسيلة سهلة الاستعمال أكثر بكثير للوصول إلى الإنترنت واستخدامها. وخلال 
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التسعينيات وبدايات الألفية الجديدة: تم تطوير تقنيات شبكية جديدة مثل شبكات اتصال 
اميدان القريب (1[10) والتواصل امطباشر (201111121112126101) 81:01111266) باستخدام 
معايير البلوتوثء والتغطية المحلية اللاسلكية الواي فاي (11111): والشبكات الوطنية 
للاتصالات المتنقلة (511/30)). TM‏ لقوانين جورج غيلدر )2000( (George Gilde)‏ 
في الاتصالاتء. فإن إمدادات العام من عرض النطاق الترددي (قدرتها على نقل البيانات) 
تتضاعف كل ستة أشهرء مع مزيد من القدرة الإضافية التي تقدمها الشبكات اللاسلكية. 
ونتيجة لهذه التطورات» فقد أصبح الربط متاحا بين الأجهزة الحاسوبية من خلال شبكة 
الإنترنت بشكل أسهل على نحو متزايدء وأسرع وعلى نطاق أوسع. 


الحوسبة الشمولية واسعة الانتشار: 

صاحب التوسع في النفاذية وقدرة الوصول إلى شبكات تقنية ال معلومات والاتصالات 
وزيادة سعات قنوات الاتصال (عرض النطاق الترددي)ء تنوع وتوسّع فى الأجهزة الرقمية 
والتي تتصل إما بشكل مباشر أو غير مباشر (حيث يتم تحميلها على جهاز آخر أولا) 
بشبكة الإنترنت لتبادل البيانات» أو التعليمات» أو الحصول على التحديثات البرمجية. 
ففى بعض الحالات» حلت التقنيات الرقمية الجديدة محل الأشكال السابقة من البيانات 
التماثلية / التناظرية» فعلى سبيل «JULI‏ 5 استبدال أنظمة الهاتف التماثلي بالهواتف 
المحمولة والهواتف الذكية» واستبدلت كاميرات الممراقبة التناظرية التي تسجّل على شر يط 
فيديو بكاميرات رقمية تلتقط الصور الرقمية» ويجري الاستعاضة عن الموسيقا المخزنة 
على الشريط المغناطيسي أو الفينيل بملفات صوتية رقمية. والنماذج الورقية بأخرى 
إلكترونية على الإنترنت. من هناء تم تحويل الأجهزة والأنظمة التي كانت تعد نسبيا 
«غبية» لتصبح «ذكية» ببعض الطرق» وعادة من خلال استخدام البرامج المرتبطة بها 
.(Dodge and Kitchin 2005)‏ وتعني كلمة «الذكية» هنا بشكل عام بآن الحهاز قد 
مت برمجته ليكون واعيا للطريقة الخاصة التي يستخدم بها وقادرا على اتخاذ قرارات 
مستقلة» «olg‏ ومؤتمتة من مجموعة الخيارات المحددة من خلال تطبيق خوارزميات 
على البيانات المنتجة (انظر 20072 1112ء16؟1 210 ©10008). وخير مثال على تجميع 
تقني «غبي» أصبح على نحو متزايد «ذي» هو السيارة» فالسيارة الحديثة يتم تحميلها 
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بأجهزة رقمية» ومستشعرات ومحركاتء والتي تراقب وتنظم أنظمتها ا مختلفة وتتداخل 
مع تجربة القيادة (2004 11116). ويمكن أن تنتقل البيانات المخزنة من هذه الأجهزة 
عبر شبكات الاتصالات عن بعد للشركات أو تحميلها من قبل مهندس لإجراء تحليل 
تشخيصي tr (Dodge and Kitchin 2007a)‏ حالات أخرىء هناك أجهزة لا مكافئ 
تناظريا dy‏ حيتث تنتج بيانات WR‏ في شكلهاء مثل تلك الناتجة عن أنواع جديدة 
من التقنيات الرقمية. والمسح الضوقء وأجهزة الاستشعار على سبيل ال مثال» ماسحات 
التصوير بالرنين المغناطيسي 14181 في مجال الصحة؛ وإضافة إلى جعلها «ذكية». فإن 
الأنظمة تعمل في الغالب على جمع أكبر قدر من البيانات قدر الإمكان» وتسعى لتكون 
هذه البيانات شاملة وليست انتقائية. وهناء قد يتم جمع بيانات عرضية أو غير ضرورية 
لتوفير الخدمة أو العملية. مثل التفاصيل الشخصية أو الموقع الجغرافي. فغالبا ما تُحدد 
الإاعدادات الافتراضية للأجهزة بشكل يتيح للناس إمكانية اختيار الانسحاتب من أنظمة 
إنتاج البيانات من خلال عقود الاستخدام للبرمجيات والمواقع» مع النص على العقوبات إذا 
اختاروا القيام بذلك» مثل تردى الخدمات» والتكاليف الإضافيةء أو حجب الخدمة بالكلية. 

وبا مثلء حصل هذا النمو في الأجهزة الرقمية في المنزل. وفي الشارع. وفي أماكن العمل. 
وعبر شبكات النقلء وفي غيرهاء مما دفع المعلقين للافتراض بأننا قد ولجنا عصر (البرمجيات 
في كل مكان -2006 .(EveryWare) (Greenfield‏ !55« هذا هو عصر الحوسبة واسعة 
الانتشار في كل مكان. حيث يتم توزيع القدرة الحاسوبية وإتاحتها في كل مكان» مع العديد 
من الأجهزة الحاسوبية التى تعمل لكل شخص )2012 (Lucas etal.‏ فالحوسبة امنتشرة 
(Pervasive Computing)‏ هى إضافة للقدرة الحاسوبية وإتاحة الوصول إلى شبكات 
تكنولوجا المعلومات والاتصالات للكائنات والسئات اللومية الثابتة لجعلها تفاعلية و«ذكية» 
.)(ourish 2001(‏ وف اممقابلء فإن الحوسبة فى كل مكان (Ubiquitous Computing)‏ 
هي القدرة الحاسوبية التي تتحرك مع الشخص بغض النظر عن البيئة؛ كالأجهزة التى 
يحملها الناس مثل الهواتف الذكية وأجهزة الملاحة عبر الأقمار الصناعية التي تعتمد على 
الوصول إلى شبكات تقنية المعلومات والاتصالات لتقديم الخدمات. وإذا كان شعار الحوسبة 
امنتشرة هو الحوسبة «في كل شيء».: فإن شعار الحوسبة في كل مكان هو الحوسبة «في كل 
مكان». مع إبراز الحوسبة المنتشرة لعمليات التباعد والتفرع (تضمين البرمجيات في مزيد من 
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الأجهزة) وإظهار الحوسبة في كل مكان لأوجه التقارب (جهاز رقمي واحد للقيام بمزيد من 
exb lxos .(Kitchin and Dodge 2011) (ell‏ الحوسمة المنتشرة أن تكون على Jhal‏ 
elan laiii (Situationally Aware) | 2s:554/, ,s352‏ تتطلب الحوسبه في كل مكان 
الإدراك امستمر للسياق وامموقع. 

:(Indexicaland Machine-Readable Identification) ةuJJ| قاىلىة الفهرسة والقراءة‎ 


على مدى نصف القرن الماضيء أصبحت الظواهر في العام أكثر وأكثر تحديدا بشكل 
فريد ومن السهوله التقاطها كبيانات. بسبب التقنيات الرقميه وتقنيات العنونه ووضع 
العلامات الجديدة. مما زاد في درجة دقتها وعلائقيتها ومن ثم مستوى التفصيل ف تحليلهاء 
بالإضافة إلى تمكين ربط مجموعات بيانات أكثر (انظر الفصل الرابع). فعلى سبيل «JULI‏ 
تتميّز كل الأجهزة الرقمية التي تساهم في الحوسبة المنتشرة والحوسبة في كل مكان بمعرّف 
فريد مُغفهرسء بحيث يُعيّن رمز تعريف حصري لكل منها مما یتح رصدها وتتبّعها على 
الدوام. وعلاوة على ذلك» فإن جميع عناصر إنترنت الأشياء (Internet of Things- IoT)‏ 
كوكبة واسعة من الأجهزة المتصلة بالشبكة: المحركاتء وأجهزة الاستشعارء تنتج بيانات 
مفهرسة مكن تمسزها بشكل فريد (2004 .21 .)Gershenfe1d e‏ وإضافة «AJ‏ فإن 
امعرفات الفريدة التى تم ربطها بالناس منذ زمن طويلء مثل جوازات السفر.ء والبطاقات 
الصحية» وسجلات التأمينات الاجتماعية» قد جرى تعزيزها من خلال أنظمة تحديد الهوية 
الرقميه والحيوية الجديدة التي تربطها بقواعد بيانات رقمية تتحقق Dodge) agusa je‏ 
.(and Kitchin 2005‏ وهذه تشمل أسماء المستخدمين وكلمات السرء وبطاقات السحب 
المغناطيسية: والقارئات الرقمية لبصمة الأصابع» وقزحية العينء والحمض النووي. وفي كل 
حالةء تعد هذه المعرفات بمثابة المصافحة الرقمية: على الرغم من أنها تختلف في مستواها 
من حيث الدقة والثقة. فعلى سبيل المثالء Sce‏ لأسماء االمستخدمين وكلمات ال مرور أن 
تسرق أو تزوّر بسهولة:؛ في حين أن الحمض النووي هو أصيل وفريد لكل شخص ويحقق 
امعايير الأربعة الأولى من قانئمة كلارك (1994 ع013:12) المتعلقة بالخصائص ال مرغوب 
فيها لتحديد هوية الكائن البشري بشكل فعال وهي: شمولية التغطية / النطاق (يجب 
أن يمتلك الجميع الخاصية نفسها)؛ التفرّد (يجب أن يمتلك كل شخص قيمة واحدة فقط 
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لهذه الخاصية: ولا يتساوى فيها أي شخصين)؛ الدوام (يجب أن لا تتغير قيمة الخاصية 
مرور الزمن» ولا تكون قابلة للتغيير أيضا)؛ اللزوم (معنى أن تعد الخاصية صفة طبيعية 
لا مكن إزالتها ولا غنى عنها). وهذه الصفات تتوافق مع الصفات السبع الأخرى وهي: 
القدرة على التحصيل/ الجمع؛ والقدرة على التخزين؛ والتفرد؛ والدقة؛ والبساطة؛ والتكلفة 
والتناسس؛ والقيول. 

وبا لمثلء فإن رموز التحديد المكانية هي أنظمة تحدّد مواقع الأشخاص. والأماكنء 
والكائنات في جميع أنحاء العالم» وتشمل خطوط الطول والعرضء وإحداثيات الخرائط 
الشبكية» والوحدات الإدارية مثل الرموز (Zip Codes) tw dl‏ وتختلف هذه الأنظمة 
في نطاقها $325 (درجة التفصبل)ء وقد أصبحت أكثر دقة a‏ من " وقت مضي 
فعلى an «JULI aua‏ البيانات الإدارية بالنسبة إلى الملكيات الفردية أو قطع الأراضي بدلا 
من الآحباء؛ كما دسجل أى جهاز يحوي نظام تحديد امواقع العامي (2051101118 0106021 
gögkl (System- GPS‏ $ نطاق بضعة أمتار؛ وبدأت أنظمة الخرائط الوطنية بإسناد عدد 
كبير من الكائنات الناشئة بفعل بشري أو طبيعي في المخططات الخرائطية بمعرفات إقليمية 
فريدة. ويوجد معرفات فريدة أخرى شائعة على نحو متزايد للمنتجات (انظر الفصل 
الرابع)ء والمعاملات (على سبيل JELI‏ طلبات الشراء)ء والتفاعلات (على سبيل المثال» البريد 
الإلكتروني واطكالمات الهاتفية). 


اا لا o£‏ كونها أكثر قابلية للفهرسة والتبوس. أصحت رموز تحديد الهوية قابلة 
للقراءة الالية WT‏ على نحو متزايد (2005 14161112 2110 1000186). على سسيل اطثال؛» 
يحتوي الرمز الشريطي le (Barcode)‏ رمز تعريف يرتبط بنظام معلومات يحتفظ ببيانات 
وصفية إضافية تصف الكائن عند مسحه بقارئ ليزري (مثل نوع اطنتج / النموذج.ء تاريخ 
ومكان الصنع: الأسعارء وما إلى ذلك). كما يمكن استشعار رقائق تحديد الهوية باستخدام 
موجات الرادیو (۸۴1۲) عن بعد من قبل مستجيب راديوي والتعرف عليها. ويمكن 
كذلك التعرف على المركبات بواسطة برنامج التعرف التلقاى على أرقام لوحاتهاء وقد تم 
تطوير تقنيات خوارزمية جديدة للتعرف وتحديد هوية الوجوه وطريقة المشي (كيف يمشي 
الناس). وهكذا أصبحت عناصر/ كائنات العالم مفتوحة لجمع والتقاط بياناتها وتحديد 
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هويتها تلقائيا؛ مما يوسّع بشكل كبير نطاق البيانات المنتجة ومدى دقتها بالنسبة إلى نظام 
ماء مما قدم أشكلا جديدة من التنظيم والحوكمة (Dodge and Kitchin 2007a)‏ وعزز 
عمل الأنظمة بطرق l8 13J. .(Kitchin and Dodge 2011) àJ! E‏ الاتجاه السائد هو 
امزيد وامزيد من التحديد للظواهر وا لممارسات لتصبح معرّفة بشكل فريد وقابلة للقراءة 
«LU‏ مما يزيد الدقة, والعلائقية: والأتمتة. 


تخزين السانات :(Data Storage)‏ 
كان هناك تحول كبير» على مدى العقدين الماضيين» في القدرة على التخزين الطويل 
الأمد لكميات هائلة من البيانات» ففى البداية تم تخزين البيانات الرقمية في صورة تناظرية 
باستخدام البطاقات المثقوبة وذلك قبل أن يتم الانتقال إلى الشريط ال مغناطيسي والأقراص 
الصلبة. وقد استكملت هذه الوسائل باستخدام وسائط التخزين الرقمية المتنقلة والتى 
EUS Lss (Floppy Disks) äl yalt eub ès‏ ظهور الأقراص اللدمجة (و02)., 
وآقراص الفيديو الرقمية (0۷2s)ء‏ ومحركات الأقراص الخارجية والذاكرة ال متنقلة (/1ءها۴ 
(Hard-disk Technologies) Lal yol Yl Soluis Heds ag .(External Drives‏ 
على وجه الخصوص. بالقدرة على تخزين البيانات الرقميهة بشكل كبيرء وذلك مع النمو 
الكبير للسعة التخزينية المقدرة بالخانة الثنانية لكل بوصة مربعة (بت/إنش2): في حين 
انخفضت التكلفة لكل غيغابايت بشكل كبير وبعامل يقدر بعشرة ملايين إلى واحد من عام 
6 إلى 2000م )2000 (Gilheany‏ واستمرت الأسعار في الهبوطء مما جعل التخزين 
الرقمي أرخص تكلفة بكثير وأقل مساحة من الأشكال التناظرية (على سبيل JULI‏ الورق أو 
الأشرطة الفلمية) (2003 1121612 220 701101514 6). فالآن: أصحت التكاليف رخيصة 
جدا وبالشكل الذي يمكن من تخزين كميات هائلة من البيانات بمقابل بخسء ودون 
الحاجة تقريباً لحذف الملفات القديمة. ونتيجة لذلكء فإن المعاملات التي تجري اليوم (على 
سبيل JULI‏ رسالة أرسلت إلى قائمة البريد الإلكتروني أو صفحة موقع التواصل الاجتماعي 
الفيسبوكء أو المدفوعات إلى متجر باستخدام بطاقة الائتمانء أو المحادثة مع أحد الأصدقاء 
على الهاتف) من الممكن تسجيلها وحفظها بشكل جيد إلى ما بعد وفاة الشخص ا معني بها.ء 

مع إمكانية الإشارة إليها وتحليلها في أي وقت في المستقبل. 
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ونتيجة لذلكء وكما نوقش في الفصل السابقء كان النمو في حجم البيانات المخزنة 
بالأرقام المطلقة والنسبية استثنائيا. وخاصة منذ العام2000م. فعلى سبيل المثال: قدّر 
5l Hilbert and López (2009)‏ خمسه وعشرين ق المائة فقط من البيانات تم 
تخزينها في شكل رقمي في عام 2000ء مع الاحتفاظ ها تبقى بأشكال تناظرية مثل الكتب» 
والمجلات: والصورء والأشرطة الممغنطة. وبحلول عام 2007 م: شكلت البيانات الرقمية ما 
نسبته أربع وتسعون في المائة من مجموع البيانات المخزنة» ومنذ ذلك الحين تواصل النمو 
للحصة النسبية من البيانات الرقمية. خاصة مع تطور التخزين والخدمات ال موزعة من 
خلال الحوسبة السحابية ومراكز البيانات. وتأخذ الحوسبة السحابية أحد شكلين يعملان 
في الغالب بصورة تعاونية: سحب اللرافق الخدمية (01000 (Utility‏ وسحب البيانات 
dosodil uua .(Data Clouds) (Farber etal. 2011) åw 5al‏ توفر القدرات 
والإمكانات المتعلقة بتقنية المعلومات كخدمات حسب الطلب حيث ممكن الوصول إليها 
عن طريق شسبكة الإنترتت وذلك بشكل مستقل عن موقع طالب الخدمة: ويشمل ذلك 
daoil dol»‏ كخدمة» (1225 £s (Infrastructure as a Service-‏ التخز ين والخوادم 
والشبكات. «المنصة كخدمة» (2225 -ع56116 2 25 213]1011123) وتضم بيئة التنفيذ 
لتطوير تطسقات مخصصة وقواعد DLJI‏ و«الرمجيات كخدمة» Software as a)‏ 
GSE ilg (Sservice- SaaS‏ ال مستخدمين من الوصول إلى التطبيقات ومعالجة البيانات 
عن بعد )2012 Ke av $ .(Farber et al. 2011; Hancke et al.‏ سحب البيانات 
من ربطء تخزينء ومعالجة كميات هائلة من البيانات التي قد تنتج عبر ا مؤسسة عن 
بعد. بالاعتماد على القدرة الحاسوبية لمثات من الأجهزةء وتحليلها عن طريق سحب 
المرافق الخدمية (2011 (Farber etal.‏ ومن تم مكن للأفراد والشركات الاستفادة 
من التخزين والقدرة الحاسوبية دون الحاجة إلى القيام باستثمارات رأسمالية كبيرةء فضلا 
عن كونها قادرة على الاستفادة من هذه الموارد من ü‏ مكان يتوافر فيه اتصال بالانترنت 
(Bryant et al. 2008)‏ 

وبا مثل» كان هناك تحول قي LAS‏ تنسيق البيانات وهيكلتها عند تخزينها. وبسبب 
الزيادة الناشئة في حجم» وسرعة»ء وتنوع البيانات» فقد عانت قواعد البيانات العلائقية 
للبقاء ومواجهة الموقف. فقد صمّمت لبيانات على درجة عالية من التنظيم: والسلامة 
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والمنظمة: والثابتة. وبدلا عنها. ظهر شكل جديد من قواعد البيانات هو قواعد البيانات 
غير الهيكلية (1705001). مما يتيح تخزين البيانات الكبيرة. وتميل قواعد البيانات غير 
الهيكلية إلى أن تكون أقل تعقيدا في الشكل من قواعد البيانات العلائقية. ولكن يمكنها 
التعامل مع كل من البيانات اkف4نظمة Unstructured) aaۈ¡ihkl رıغو (Structured Data)‏ 
(Data‏ وهي قابلة للتوسع بسرعةء وهكنها التعامل فعلا مع العديد من مجموعات 
بيانات سريعة التغير وهائلة في الحجم. وتمتاز بالمرونة في كيفية تنظيمهاء مما يتيح هياكل 
بيانات مفصلة بحسب الطلب (2012 117011612 220 WS .(Driscoll 2012; Marz‏ 
تميل قواعد البيانات غير الهيكلية إلى تخزين البيانات الابتدائية الخام بدلاً من المشتقة 
التي يتم هيكلتها وفقا لعلاقة محددة سالفا (2012 1:15»011). فعلى سبيل المثالء تخرّن 
قواعد البيانات غير الهيكلية معلومات خام عن زيارة صفحة الويب (المشاهدة) بدلا 
من تخزين تعداد المشاهدات للصفحات المشتقة منهاء وهي إستراتيجية أكثر قوة من 
حيث أنها تقلل من الأخطاء المحتملة في قواعد البيانات» ولكن هذه الإستراتيجية لا مكن 
تطبيقها مع قواعد البيانات العلائقية بسبب النمو السريع والحجم الناتج من ذلك النمو 
والذى لا مكن التعامل معه من خلالها (2012 .(Marz and Warren‏ ويتم Solz à‏ 
توزيع البيانات وتكرارها عبر العديد من الأجهزة في قواعد البيانات غير الهيكليةء بدلا من 
مركزيتها في مكان واحد (ومن ثم حل مشكلة مجموعات البيانات الكبيرة جدا كونها كبيرة 
جدا عن أن يجري احتواؤها على جهاز واحد). وتقسّم طلبات الاستعلام ويجري تنفيذها في 
الوقت نفسه على عدد من الأجهزة جنبا إلى جنب ثم يُعاد تجميع النتائج (ومن ثم تسريع 
العملات الحسابة) (2012 1011112111). وتتلخص هذه اللإستراتيحية من خلال تقنه 
التعيين والاختزال JI (ReduceMap)‏ ( تم تطويرها من قبل شركه جوجل حيث يتم تعيين 
البيانات والاستعلامات على عدة خادمات ومن ثم جمع النتائج الجزئية واختزالها lina‏ 
(2012 1111ن12). ويعد هادوب (م113000).: الذي تم وضعه بداية من قبل شركة ياهو 
(Yahoo)‏ مثالا على قواعد البيانات غير الهيكلية ومفتوحه ال مصدر وشائعة الاستخدام في 
تطبيق نموذج التعيين والاختزال. فالحل البديل بمثل هذا النهج يتمثل باستخدام نموذج 
أكثر محدودية للبيانات. ودرجة أقل من العلائقية في مجموعة البيانات. وقدرة أقل على 
الاستكشاف باستخدام لغة الاستعلام العلائقة (2012 011ع10115) (.5)21). وهذا يعني 5l‏ 
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قواعد البيانات غير الهيكلية مثالية للتخزين الفعّال والاسترجاع السريع لكميات هائلة من 
OLLI‏ ولكنها أقل فائدة لفحص العلاقات بين عناص البيانات (مركز تحالف البيانات 
dklختوحة‏ 2012 Open Data Center Alliance‏ 


مصادر السانات الكىىرة :(Sources of Big Data)‏ 
وفر التوسع الجذري والتكامل بين الحوسبةء والشبكات» والأجهزة الرقميةء وتخزين 
البيانات منصة قوية لانطلاقة البيانات الكبيرةء وإضافة لذلك الوسيلة التي يتم بها إنتاج 
ومعالجة: ومشاركة: وتحليل البيانات الكبيرة. ومكن تصنيف هذا الإنتاج للبيانات فى ثلاث 
LS‏ رئيسية. البيانات الموجهة (10368 160ء1(116) والتي يتم إنتاجها بوسائل مراقبة 
تقليدية. حيث تتركز أنظار التقنية على شخص أو مكان من قبل Jis‏ بشري. أما في حالة 
البيانات الآلية (1(28 4116011260 ): فتنتج البيانات عن وظيفة كامنة في الجهاز أو النظام 
بطريقة تلقائية» في حين يتم تداول البيانات الطوعية (10268 0ع1701101116661) وإهداؤها من 

قبل الناس للنظام. 


السسانات الموجهة :)(Directed Data)‏ 
توجد الطمراقىة ال منظمة والصسيكلية حيثما وجدت مجموعة من الناس الذين يشرفون 
على أشخاص آخرين كالمسؤولين عن إنفاذ القانونء والمعلمينء والأطباء. ومسؤولي الرعاية 
الاجتماعية: والبيروقراطيينء ورؤساء العمل والذين يعملون على مراقبة الآخرين شخصيا 
كا مواطنينء والتلاميذء والمرضىء والعمال أو من خلال العدسات التقنية كا مسوح مثل التعداد 
السكانيء ونماذج البيانات الحكومية: وإيصالات الضرائب» وعمليات التفتيشء. وكاميرات 
مراقة الدوائر التلفزيونية ال (CCTV) a Als‏ حيث كانت اطراقة المطنظمة والصدكلية 
áb slo 559 Js‏ سمة من سمات المجتمعاتء TM lisa‏ من مكونات الدولة وحوكمة 
الشركات (2007 .)1٥١‏ فهذا النموذج للتحكم (التداخل اممنطقي» الأدوات» المؤسسات» 
وأدوار وإجراءات الحوكمة) يتيح مركزية التنظيم والتحكم عبر مجموعة واسعة من 
ا لمجالات» ويساعد ف الحفاظ على النظام» وإنتاج حكومة جيدة: وإدارة فعّالة. وعمل مربح. 
ومجتمعات مستدامة ومستقرة» من خلال ال محاسبة الفعّالة للأشخاص والتهذيب الذاق 
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ا (معنى» تعديل الناس سلوكهم ليتوافق مع التوقعات والقواعد). وتنم كفل هذه 
النظم بطرق تحديد هوية الأفراد. مثل بصمات الأصابع: والصورء وأرقام التأمين الوطني أو 
الضمان الاجتماعي» وجوازات السفر ورخص القيادة: التي تجعل من السهل تتبع واقتفاء 
آثر الناس» كما تم توسيع نطاق المراقبة ليشمل الحيوانات والبيئات. واستخدام الكائنات 
وحركتها. 

وحتى وقت قريبء كانت كل عمليات امراقبة جزئية وتناظرية بطبيعتها وتنتج 
b az aco‏ مختلفة من ads colo XUL ipa la cd al Ld‏ المستفلة إل السكلات 
التفصيلية أو التسجيل المستمرء ويجري تطبيقها أحيانا على عينات وفي حالات قليلة على 
المجتمع بأكمله. وكانت البيانات المسجّلة انتقائية. تجمع من خلال التقارير أو الإبلاغ 
الذاتي على الورق أو على شريط مغناطيسي أو فيلم؛ في مكان وزمان معيّنين. وتميل البيانات 
إلى أن تكون منظمة للغاية في طبيعتها. ومقتصرة على مجموعة من حقول البيانات المحددة 
مسبقا. وكانت السجلات ضخمة ومكلفة في التخزين: مما يعني عدم الاحتفاظ الطويل 
الأمد بها إلا لكمية محدودة من البيانات: إضافة إلى كون الكثير منها إما عبارة عن عينة 
أو مشتقة. وحتى ف الحالات التي قد تكون اطراقبة فيها مستمرة: مثل الدوائر التلفزيونية 
المغلقة. فقد تمتد اللقطات نفسها على فترات زمنية طويلة تتعدى قدرة الشريط التسجيلي 
على تغطيتها ويجري في العموم إعادة التسجيل عليها بعد فترة معينة (غالبا بعد سبعة 
أيام أو شهر). كما كان تحليل البيانات الناتجة من مختلف أشكال المراقبة المستخدمة 
يتم بواسطة مفسّر بشري إلا إذا جرى تحويلها رقميا في وقت لاحق. وفي حين أن كميات 
البيانات التي تنتجها هذه المراقبة يمكن أن تكون ضخمة: وربما تستوفي واحدة أو اثنتين من 
الخصائص المرتبطة بالبيانات الكبيرة مثل قابلية الفهرسة والشمولية والعلائقية أو السرعة. 
إلا آنه لا مكنها بآى حال أن تستوف مجموعة الصفات المرتبطة بالبيانات الكبيرة كاملة. 

وف حين لا تزال العديد من أنظمة المراقبة والحوكمة مستمرة في كونها جزئية وتناظرية, 
كان هناك تحرّك في الآونة الأخيرة لاستبدالها والتوسع فيها بنظائر رقمية مكافئة لها والتى 
تنتج الآن بيانات كبيرة. فعلى سبيل المثالء يجري استبدال أنظمة الدوائر التلفزيونية 
المغلقة التماثلية الثابتة بأخرى رقمية متحركة حيث كن تغيير مجال الرؤيةء والتقليل من 
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ا لمحددات على التخزين» وتعزيز التفسير البشري بتحليلات خوارزمية حسابية» مثل التعرف 
على الوجه أو طريقة ا مشيء كما مكن ربط مثل هذه البيانات مع قواعد بيانات أخرى. 
وهناء يوجّه تركيز الكاميراء وعمليات التحليل والتفسيرء من قبل مشغل بشريء وبمساعدة 
من البرمجيات. على سبيل امثال. من الممكن مراقبة وضبط العديد من الكاميرات في 
غرفة عمليات الشرطة وربطها بسجل الحوادث الحية من أجل الاستجابة بكفاءة وتوجيه 
امموارد المناسبة لمواقع معينة بشكل استباقي. وبامثلء في مراقبة الهجرة والجوازات. حيث 
يجري آنيا جمع معلومات الركاب التفصيلية وتدقيقها مع مختلف قواعد البيانات الأمنية 
والحدوديهة بشكل ني أو لحظي (Real-Time)‏ وإنتاج بيانات جديدة مثل ال مسح الضونى 
للصور الشخصية وبصمات الأصابع أو قزحية العين. وتستخدم العديد من الحكومات 
ame az da lo] ado] dll‏ مشاركات المواطنين مع خدماتها آنيَا وَرَضَدإن كان تعامل 
الموظفين مع أي قضايا قد تم ضمن آطر زمنية محددةء مع مراقبة مديري الإشراف للنظام 
لإعادة توجيه اموارد بحسب الحاجة. 

وتتكوّن بعض الأنواع الأخرق الأقل انتظاما فى إنتاج البيانات الكبيرة الموجّهة من: 
التصوير الجوي الرقمي عن طريق الطائرات أو الطائرات بدون طيارء أو الفيديو المكانيء 
أو اللبدار (الرادار بتقنية الليزر) لكشف الضوء وتحديد مدى البُعدء Sl‏ الحرارية أو غيرها 
من أنواع الأشعة الكهرومغناطيسية للبيئات التى تمكن من الرسم المتحرك للخرائط الثنائية 
والثلاثية الأبعاد للمناظر الطبيعية المفهرسة مكانياً بشكل آني أو لحظي )۸٠۵1-۲1۳۲(‏ من 
خلال نظام تحديد المواقع العالمي (6725©). وتنتج مثل هذه الفيديوهات وال مسوح بالأشعة 
كميات هائلة من البيانات المتنوعة عالية السرعة. فعلى سبيل المثال يمكن لماسح الليدار 
توليد مليون نقطة بيانية» مع دقة بيانية تصل إلى بضعة سنتيمترات» مع إمكانية إجراء أكثر 
من مسح خلال الثانية الواحدة. إن وضع ماسح ليدري فى مركبة وقيادتها في الأنحاء أو 
الطيران به فوق منطقة معينة ينتج تمثيلا ثلائي الأبعاد مفضّلا للغاية للتضاريس الطبيعية 
لتلك المنطقة. 
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البيانات (Automated Data) àJV!‏ : 
في حين وسّعت البيانات الموجّهة أنظمة المراقبة والحوكمة التقليدية. فقد حول إنتاج 
البيانات الآلية بشكل جذري كيفية إنتاج البيانات وتوظيف استخداماتهاء ومكن من إنشاء 
أنظمة جديدة للتنظيم والإدارة التلقائية Dodge and Kitchin 2007a, Kitchin and)‏ 
La2J] ,13l :Dodge 2011‏ | العاشر). فمن خلال مجموعة من التقنيات الرقمية يتم إنشاء 
البيانات تلقائيا بواسطة مجموعة مز النظم الآلية وبرقابة بشرية قليلة. وعلاوة على 
ذلكة يعم ف الغالب مغالجة.وتحليل us LUIS oL oda Jta‏ كل مستقل: إذ يجري 
العمل عليها بواسطة خوارزميات برمجية لتحقيق نتيجة معينة تهدف إلى تنظيم ظاهرة 
ما. وهناك طرق عديدة لإنتاج البيانات الالية. بعضها قد يكون إنتاجه bol‏ عن النظام 

وليس من صميم عمله. 


المراقبة الآلة (Automated Surveillance)‏ : 
كما أصبحت تقنيات المراقبة زقمية بطبيعتها ومرتبطة بعضها ببعضء. فقد أصبح من 
اممكن Lal‏ أعمتة جوانب متعددة لنظام المراقبة. وإضافة تقنيات جديدة» لتتبع أكثر فعالية 
وكفاءة في مراقبة وتتبع الاستخدام للأنظمة والأماكن المختلفة. وتعد قراءة العدادات 
الذكية مثالا على النموذج اليدوي من الراقبة التى غدت آلية بشكل متزايد. هناء يتم 
استخدام تقنية قراءة العداد آلا Automatic Meter Reading- AMR)‏ ) مراقبه استخداح 
الالة والتواصل معها دون الحاجة إلى القراءة اليدوية التقليدية (2013 (Hancke et al.‏ 
وعلاوة على ذلك يمكنها القيام بهذه المهام بشكل متواصل مما يمكن اللمورّد من تتبع 
الاستخدام بشكل آني أو لحظيء وهذا له فائدة في مطابقة الطلب مع العرض وفي العثور 
على أخطاء / تسريبات في النظام. كما أنها توفر وسيلة للقيام بالفوترة الآليةء مما يحدّ من 
نفقات التوظيف. وف كثير من الحالات: من الممكن للمستهلك أيضا أن يراقب استهلاكه 
الخاص لخدمة معينةء مثل الكهرباء أو الغاز أو المياه. فعلى سبيل المثالء يممكن استخدام 
تطبيق للهاتف الذي للاتصال بعداد عن بعد باستخدام تقنية اتصال المجال القريب على 

سبيل JELI‏ البلوتوث: ومن ثم تغيير الاستهلاك تبعا لذلك. 
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وبا مثلء تعرز أنظمة إدارة ا مرور من القدرة على تنظيم وضبط السائقين من خلال 
الاستفادة من تقنية التعرف الالي على el;‏ لوحات ال مركات Automatic Number Plate)‏ 
.(Recognition- ANPR) (Dodge and Kitchin 2007a‏ فھناء مسح الخوارزمیات 
بيانات الصور من الكاميرات الرقمية للكشف عن لوحات الترخيص. ومن جهة:. يمكن 
استخدام هذه ال معلومات لتتبع ا مركبات خلال عبورها على طرقات امدينة وتقديم مدخلات 
إلى نظم النقل الذكية áaz 5s «(Intelligent Transportation Systems- ITS)‏ 552« 
مكن إحاله هذه البيانات إلى قاعدة بيانات مالي المركبات لإدارة الغرامات والعقوبات 
المتعلقة با مخالفات ال مرورية. فعلى سبيل المثال» بالنسبة للمثال السابق» يتم فحص لوحة 
الترخيص لجميع المركبات الداخلة إلى منطقة الزحام المروري في لندن ومطابقتها مع قاعدة 
بيانات تلك المركبات التى سددّت رسووه الازدحام: أما تلك التي لم تسدّد خلال فترة أربع 
وعشرين ساعة فيتم تغريم مالكيها تلقائيا من خلال عملية الإدارة الآلية (يتمتع النظام 
باستقلالية ف إصدار الغرامات دون الحاجة لرقابة بشرية). ويمكن للنظاء بالمثل استخدام 
كاميرات السرعة لإصدار قسائم تجاوز السرعة للسائقين المخالفين. 

وفي حالات أخرىء تم تسهيل الراقبة الآلية من خلال استخدام رموز الهوية المقروءة 
آليا لتسجيل ماهية الأنشطة المريبة/ المجهولة على شبكة المراقبة. فعلى سبيل المثال» تمّ 
استبدال التذاكر الورقية التي يتزايد تبادلها في السفر على نظام النقل من غير حامليها 
بالبطاقات الذكية» التي ينبغي التدقيق عليها لدخول وخروج المحطات ووسائل النقل. 
ويتمٌ إنشاء سجل عند نقاط ا مسح ومن ثم يمكن تتبع كل حركات حاملي البطاقات الذكية. 
وفي حالة نظام النقل في لندن» فإن استخدام بطاقات أويستر (0(5161) يعني أنه من 
الممكن تتبع الرحلات الفردية عبر نظام الحافلات والسكك الحديدية المستخدمة من قبل 
às.‏ راكب ya «bbs .(Batty et al. 2012) WM‏ ال ممكن الان اطراقة التلقائية 
لأشكال متنوعة من الخدمات العامة المقدمة التي كان يجري رصدها عرضاء مثل جمع 
النفايات» من خلال استخدام رقائق تحديد الهوية باستخدام موجات الرادیو ([۸۴1) التي 
تثبّت على حاويات النفايات ويتم مسحها عن بعد عند نقاط الجمع. وأصبح من الممكن 
قياس كميات التخلص من النفايات باستخدام مقاييس مرفقه مجموعة مركبات وتحميل 
الأسر بصورة فردية تكلفة التخلص من النفايات على أساس الحجم بدلا من الرسم الموححد 
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دون تمييز. كما أصبح من الممكن أيضا الحصول على فهم مفصّل لأماط التخلص من 
obl‏ داخل منطقة ما وإعادة تخطيط طرق وأوقات الجمع. 


(Digital Devices) &4e3 JI 8542 VI 
كما سبق الإشارة إليهء كان هناك نمو هائل في عدد الأجهزة الرقمية ا مستخدمة حول‎ 
العام والتي تساعد على تسهيلء وتعزيزء وإدارة العديد من جوانب الحياة اليوميه. فهذه‎ 
الأجهزة لا تقوم مجرد معالجة البيانات الرقمية والتعليمات فحسب» ولكنها تنتج بيانات‎ 
رقمية بشكل نشط وكوظيفة أساسية لها أو ثانوية: أو الاثنين على حدّ سواء. ومن الأمثلة على‎ 
الأجهزة التي تنتج بيانات رقمية كوظيفة أساسية: الكاميرات» وأشرطة الفيديوء والمراقيب‎ 
ووحدات تحديذ المواقع (6725): وأشكال مختلفة من المعدات الطبية مثل كاميرات المنظار‎ 
والماسحات با موجات فوق الصوتية: وموازين الحرارة الرقميةء إلخ. أما أمثلة الأجهزة التي‎ 
تنتج بيانات رقمية كوظيفة ثانوية» فتشمل الهواتف النقالة ومستقبلات البث التلفزيوني‎ 
عبر الكابل أو الأقمار الصناعية» والتي تنتج بيانات متعلقة بكيفية استخذامها (على‎ 
سبيل اطثالء الوقتء ال مكان. الشخص المتصل / القناة المشاهدة). مع البيانات المتصلة‎ 
بها والتي جرى جمعها في سجلات يتم إرسالها إلى أطراف ثالثة (مثل مصنعي الأجهزة‎ 
ومقدمي الخدمات). أما الأمثلة على الأجهزة التى تنتج البيانات الأساسية والثانوية معا‎ 
فتشمل الهواتف الذكية التي يمكن استخدامها لتسجيل الملاحظاتء والتقاط الصورء وكتابة‎ 
البريد الإلكتروني والتعليقات على وسائل التواصل الاجتماعي. ...إلخ: بالإضافة إلى تسجيل‎ 
استخدام مختلف التطبيقات. وتشكل هذه الأجهزة سلالة جديدة من الكائنات» تسمى‎ 
كائنات ترصد وتتبع تاريخ‎ - )ا0gjects(‎ )Kitchin and Dodgچe‎ 2011( لوجکتس‎ 
استخدامها الخاص. وفي كثير من الحالات: يكون من ال ممكن تسجيل موقع هذه الأجهزة.‎ 
فالهاتف الجوال والهواتف الذكية ممكن تتبعها من الفضاء عن طريق التثليث (حساب‎ 
عن طريق مستقبلات تحديد المواقع المدمجة فيها.‎ Laly المثلثات) عبر هوائيات الهاتفء‎ 
ومقاييس التسارع‎ (Gyroscopes) بالإضافة إلى مراقبة السرعة والاتجاه من خلال امدوار‎ 
على شكل أقراص أسطواننية: أو أجهزة‎ (Compasses) Mogla (Accelerometers) 
ملاحة بالأقمار الصناعية أو أي أجهزة أخرى. وعلاوة على ذلك فإن العديد من هذه‎ 
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الأجهزة يمكن أن تتفاعل بشكل مستقل بعضها مع بعض وتقوم بتبادل البيانات. ومع تكاثر 
الأجهزة المعقدة لكافة المهام وف كل الأماكن» يتم إنتاج المزيد والمزيد من البيانات الغنية 
بالبيانات الوصفية القابلة للفهرسة» مما يتيح تحليلا أكثر تطورا واستحداث إستراتيجيات 
ومنتجات جديدة قاتئمة على اليانات. 


السانات المستشعرة (10262 0ع5115): 

تعد المستشعرات ول محركات من أنواع الأجهزة الرقمية. وهي ما يمكن أن تكون ضمنا 
أو جزءا من هياكل مختلفة لقياس مخرجات معينة مثل مستويات الضوء» والرطوبة» ودرجة 
الحرارة: والغازء وا مواد الكميائية» والمقاومة الكهربائية» والصوتيات» وضغط الهواء والحركة 
والسرعة: ...إلخ. وتعد أجهزة الاستشعار والمحركات صغيرة. وغير مكلفة فى العموم: ويمكنها 
إنتاج تيازمُستمر من البياناتء ويمكن أن تكون سلبية وتقرئ بواسطة الماشحات الضوئية, 
Ob Se 9l‏ تكن #نشطة حك تنك الببانات عاين Col xS‏ منعظالة. عين :الك الحاسب 
ا محلية أو الواسعة: أو قد يكون لديها قدرة الاتصال من خلال حقل الاتصالات القريب 
(NFC)‏ والذي يتيح الاتصالات à‏ اتحاهن (2013 (Hancke et al.‏ وبوضعھا علی جسرء 
يممكن للمستشعرات أن تقيس وتتواصل لحساب معدلات التآكل (عن طريق قياس المقاومة 
الكهربائية) ومقدار الضغط على مواد البناء باستخدام أجهزة استشعار الانبعاثات الصوتية 
(للكشف عن انتشار ال موجات الصوتية) وأجهزة استشعار التخصّر المغناطيسي (للكشف عن 
تغيرات في الحث ال مغناطيسي). ومن ثم يقلل ذلك من الحاجة إلى التفتيش اليدوي ال مكلف 
5s .(Hancke et al. 2013)‏ مكن للمستشعرات داخل نظاه امياه قياس نوعية 
امياه. وضغطهاء ومقدار تدفقهاء وتمكين الإدارة الآنية وصيانة الأنابيب لحظة بلحظة. وعلى 
«US AI‏ يمكن للمستشعرات رصد حجم العملء والإجهاد. والتضاريس. فشركة هيتاثي 
تستخدم هذه المجسات لرصد مركباتها الثقيلة المعقدة والمكلفة. وكذلك تفعل الشيء نفسه 
شركة النقل السريع (1725) مع أسطولها من عربات النقل والشاحنات بحيث توظفها 
لتشغيل خدماتها بكفاءة وبصورة اlسفتıiاقة Plumridge 2012; Mayer-Schonberger)‏ 
Cukier 2013‏ 4ہa).‏ ومن خلال ربط رقائق تحدید الهویه باستخدام موجات الرادیو 
OL 2b (RFID)‏ أصبح من الل ممكن رصد وتتبع حركة الوحدات الفردية من المصنع 


Jnd ox ent M x M T 
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أو المزرعة إلى المستهلكء والحد من السرقة والهدر. وبال مثل. تحتوي بطاقة الضريبة على 
شريحة تحديد الهوية باستخدام موجات الراديو التي تتواصل مع قارئ ترددات راديوي 
على حواجز تحصيل الرسوم» مما يؤدي إلى سرعة أعلى في حركة المركبات والدفع الآلي. 
بالإضافة إلى حساب معدل حركة ال مركات أو عدد مواقف الساارات المتاحة لإدارة حركة 
المرور. كما تثبّت رقائق تحديد الهوية باستخدام موجات الراديو على الحافلات والقطارات 
والتي تتواصل مع قارئ ال موجات الراديوية على طول مساراتها مما يجعل من الممكن تتبع 
موقع المركبات ف أي لحظة آنيا. 

كما يمكن إنشاء شبكة استشعار كثيفة من خلال توزيع العديد من أجهزة الاستشعار 
وربط البيانات التي تنتجهاء مما يتيح رصد أوضاع مختلفة عبر نظام أو مكان ما. وقد 
توالت الأمثلة على هذه الشسكات وأجهزة الاستشعار في مدينة سانتاندر à (Santander)‏ 
إسبانيا كجزء من مشروع (SmartSantander) à .$3Jl 45A‏ 4,35 12000 من أجهزة 
الاستشعارء وتتكون من خمسة أنواع, تم توزيعها بشكل إستراتيجي في جميع أنحاء المدينة 
لقياس الضوضاء. والحرارة» ومستويات الإضاءة المحيطة» وتركيز غاز أول أكسيد الكربون. 
والأماكن المتوافرة لوقوف السيارات وركنها (2013 816154). وترتط أجهزة الاستشعار معا 
من خلال الاتصالات اللاسلكية وتوظيف البرمجة عبر الأثیر (014۶)» مما هكن من برمجتها 
وتحديث برمجياتها عن بعد (2013 816158). كما يجري تطوير وادی بلان آي تی (PlanIT)‏ 
في البرتغال. وهو في الوقت الحاضر تحت الإنشاء ومصمّم لإيواء 225 آلف نسمةء ويهدف 
إلى إنشاء بيئة قائمة على أكثر من 100 مليون جهاز استشعار مدمج فيها والتي سوف تنتج 
بيانات لرصد مجموعة متنوعة من النى التحتية والسئات (2012 126]61ع1121). وهكذاء 
يُنظر إلى المستشعرات بوصفها عنصرا أساسيا في التطورات التي تشهدها المدينة الذكية. 


ساناث المسح الضوني :(Scan Data)‏ 

بالإضافة إلى الأجهزة الرقمية وأجهزة الاستشعار التي تنتج البيانات بشكل نشط والتي 
هي جزء من شبكة إنترنت الأشياء» من الممكن رصد وتتبّع الكائنات الأخرى رقميا من خلال 
رموز الهوية المقروءة اليا. وقد تجاوز استخدام الرمز الشريطي (Barcode)‏ قطاع البيع 
بالتجزئة ليشمل السلع المصنعة والاستمارات الرسمية. كما وضعت العديد من ال منظمات 


ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة: والبنى التحتية للبيانات» والنتائج المترتبة عنها 10 


AA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


الفصل الخامس 


الكبرى والقطاعات الصناعية نموذجها الخاص من الرمز الشريطي ومعاييرها لتخصيص 
الأرقام )2005 JE gs „(Dodge and Kitchin‏ البيانات في الرموز الشريطية ثناشة الأبعاد 
أفقيا mET‏ مجموعة من النقاط المطرقطة ومكن استخدامها لتحديد كائن بشكل فريد. 
وتستخدم بعض خدمات البريد هذه الرموز الشريطية الثنائية الأبعاد لتمكين المتابعة 
والتعقيب للرسائل والطرود البريدية بشكل فردي. وبامثلء» تحتوي الشرائط المغناطيسية 
المثبتة على بطاقات الائتمان والولاء وبطاقات السماح بالعبور من خلال الأبواب على معرّف 
فريد يختص بصاحب البطاقة التي يتم قراء ءتها عند تمريرها على القارئ. وقد حرى استبدالها 
لاحقا برقائق إلكترونية يمكن التحقق من البيانات التفصيلية فيها باستخدام الأرقام السريّة 
الشخصية لمستخدميها. كما يتم إنتاج البيانات الخاصة بالاستعمال. في كل مرة يجري فيها 
مسح الرمز الشريظي أو الشريط المغناطيسي أو الرقاقة الإلكترونية, متضمنا ذلك أين ومتى تم 
الاستخدام ولأى غرض. وبالنظر إلى أن الغرض من هذا المسح فى كثير من الحالات هو لشراء 
السلع» فهي توفر وسائل مهمة لإنتاج معلومات عالية الدقة والتفصيل للضفقات المبرمة. 


البيانات التفاعلية (102162 111]1:211011): 

على الرغم من أن بعض مستخدمي الإنترنت ينظرون إليها باعتبارها وسطا مجهول 
ا معام إلى حذ ماء إلا أن كل تفاعلات المستخدفين الجارية عبر شبكات ال معلومات والاتصالات 
تنتج بيانات تفاعلية. وحقيقة: فإن cl‏ البيانات هو قائم بطبيعته على العديد من أشكال 
الاتصال والاستخدام في شبكات تقنية المعلومات والاتصالات. على سبيل JELI‏ يتعقب 
مزودو خدمات الإنترنت ال مواقع التى تتصل بها حسابات المستخدمن الفردية والأجهزة 
وتستخدم العديد من المواقع» وخاصة مواقع الشركات. سجل التتبع وتعريف الارتباط 
للمتصفح (كوكيز 00016165) لإنتاج بيانات النقر (اختيارات المستخدم)» لتتبّع كيفية تنقل 
المستخدم خلال امموقع على شبكة الإنترنت وما الميزات التي جرى اختيارها. وبشكل عام 
تستخدم مثل هذه البيانات مراقبة كيفية أداء الموقع الإلكترون» وإجراء أبحاث عن السوق 
وتتبع مسار إنتاجية الموظف» مع إمكانية بيع هذه البيانات إلى أطراف أخرى. ويتم 
إنشاء بيانات النقر هذه بصورة تلقائية ما م يعد المستخدم تطبيق المتصفح لعدم قبول 
ملفات تعريف الارتباط (وهذا قد يضعف استخدام الموقع). وبامثل» يتم تخصيص رموز 
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تعريفية فريدة في جميع الصفقات امالية القائمة على تكنولوجيا ا معلومات والاتصالات. 
سواء الخدمات ال مصرفية الشخصية الالكترونية» أو عمليات سحب أموال من أجهزة الصراف 
JYI‏ أو عمليات المتاجرة في الأسهم: ويجري تخزين بيانات هذه المعاملات lls‏ وتحتوی 
جميع رسائل البريد الإلكتروني على رؤوس في مقدمة حزم بياناتها والتى تقوم بتحديد البريد 
الإلكتروني بشكل فريد» وتحتوي على معلومات تشمل المرسل والمتلقيء والخوادم والأجهزة 
المستخدمة. وعلى المنوال نفسه. يتم تمييز جميع المكالمات الهاتفية بمعلومات المتلقى 
للمكالمة. ووقت إجرائها ومدة بقائهاء وما إذا كان الهاتف محمولا واموقع. ونتيجة لذلك 
يتم إنشاء كميات هائلة من البيانات بشكل روتيني بشأن التفاعلات الحاصلة عبر شبكات 
تكنولوجا المعلومات والاتصالات. 


السانات التطوعة :(Volunteered Data)‏ 
على النقيض من المراقبة الموجهة إلى الأشخاص أو الأشياء من قبل الأفراد والهيئات: 
أو تلك التي يتم التقاطها تلقائيا باعتبارها ميزة متأصلة لجهاز أو نظام ماء فإن كثيرا 
من البيانات الكبيرة يتم إنتاجها من قبل الناس بشكل تطوعي فعال. ففي مثل هذه 
الحالات. ينتج الأفراد السانات ويقومون بإدخالها للعمل على الاستفادة من خدمة 
(مثل وسائل التواصل الاجتماعي)» أو المشاركة في مشروع جماعي مثل مشروع خريطة 
الشارع المفتوح bauuSo s CGY de gusa sl (http://www.openstreetmap.org)‏ 
.(https://www.wikipedia.org)‏ 299( مشثل هذ العمل بالإنتاج الاجتماعي 
bU là 25 Ga» (Prosumption)‏ الإنتاج والاستهلاك L.5;e-‏ بعضها قي بعض» 
مع اتاب has 31 39I‏ ق إنتاج الخدمة أو امنتج الذي يستهلكونه (220 :م1812 
leò .(Jurgenson 2010‏ سبيل «JULI‏ يجري إنتاج واستهلاك محتوى مواقع التواصل 
الاجتماعي في ذات الوقت من قبل الأفراد المستخدمين عن طريق إدخال التعليقات. 
تحميل الصور ومقاطع الفيديوء وا لملشاركة في مناقشة وتبادل المشاعر («الإعجاب» 
أو «عدم الإعجاب» للشيء). ومن خلال جهودهم الجماعيةء ينشئ الأفراد المنتجات 
والخدمات التي يشاركون فيها ويضيفون قيمة لها ويستخرجون القيمة منها. بحسب ما 
أشار إليه (2006) 8612161 مصطلح «ثروة الشبكات». وق معظم الأحوال؛ يقوم أفراد 
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الإنتاج الاجتماعي بهذا العمل الإضافي بمقابل مادي قليل أو دون أي تعويضء وذلك إما 
للحصول على متعة المهمة: أو الشعور بالسلطة. أو توفيرهم امال والوقت مع انخفاض 
تكلفة الخدمة والتى غالباً ما تصبح أكثر مرونة بطبيعتها مثل الخدمات المصرفية عبر 
الإنترنت أو الحجز في رحلة طيران من ال منزل. ف المقابلء يتلقى مزود الخدمة أو متاجر 
التجزفة عملا دون تكلفة: بالآضافة إل الخيرات والآزاء واللغرفة واكتسات الكفاءة 
ومعلومات ذات قيمة من خلال القرب أكثر من العملاء / الزبائن والقدرة على تسسيل 
بياناتهم )2013 .(Ritzer and Jurgenson 2010; Dodge and Kitchin‏ فیعض آشکال 
الإنتاج الاجتماعي هي أقرب إلى الخدمة الذاتية ومقيدّة بطبيعتهاء مع قيام أفرادها بالأعمال 
التي كانت مسندة إلى موظفينء في حين أن البعض الآخر أكثر انفتاحا وتفاعلية. وهنا 
سيتم مناقشة خمسة أشكال للسانات التطوعية باختصار : (Transactions) Eds‏ 
ووسائل التواصل الاجتماعي (116012 506121).: والمراقبة !4.27 (Sousveillance)‏ 
والتعهيد الجماعى (Citizen Science) d&iblg$l eleg «(Crowdsourci¬g)‏ 


(Transactions) cXelszaJI 
Jas يتطلب الشراء عن طريق الإنترنت من المشتري إدخال البيانات الشخصية له فيما‎ 
عملية الدفع والعنوان وغيرها من البيانات الوصفية الضرورية الأخرى باعتبارها جزئيا‎ 
عملية للتحقق وتبادل المعلومات ولكن أيضا لمعرفة المزيد عن المستهلك. وعادة ما تكون‎ 
التفاعلات في مثل هذه التبادلات محدودة إلى حد ماء وتقتصر على اختيار ماهية بنود‎ 
الشراءء والعديد من حقول البيانات الإلزامية لوضع اللمسات الأخيرة وإتمام عملية الشراء.‎ 
وبعد تبادل اممعلومات» من الممكن طلب المزيد من المعلومات من المستخدمينء إما لتقييم‎ 
الموقع وخدمة العملاء. أو لتصنيف ومراجعة بيانات البند الذي تم شراؤه. وتضيف‎ slol 
بيانات ال مراجعة هذه قيمة للموقع من خلال اقتراح كيفيه تحسين التصميم وكذلك تزود‎ 
المستهلكين الآخرين بردود الأفعال (15ءع16602) عن مدى جودة وكفاءة ال منتجات. فعلى‎ 
مكن لآفر اد الإنتاج امجتمعي‎ «(http://www.tripadvisor.com) |]-is 43s 5SJl مواقع‎ 
تقييم واستعراض الفنادق وخدمات السفر الأخرىء مثل البيانات التي يجري تقدهها طوعا‎ 
على الموقع عن حركة المرورء وبث الإعلانات والإشارة إلى مواطن الربح ا محتملةء مما يكون‎ 
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له تأثير ملحوظ في اختيارات المسافرين الآخرين. كما يوفر الموقع بيانات مفيدة حول 
الشخص الذي تطوّع لإجراء الاستعراض والتقييم» مثل خيارات أسلوب الحياة والإنفاق 
خلال السفر التى يمكن تسييلها ماليا عن طريق بيعها إلى أطراف ثالثة. وبالمثل: تتظلب 
تعبئة النماذج الإلكترونية الحكومية من المواطن تقديم معلومات للموقع بشكل تطوعي. 
وهناء يكون هنالك تبادل للبيانات يتعدى حدود عملية الدفع للمبالغ النقدية» فبعض 
البيانات الإضافية الأخرى يمكن أن تكون مرتبطة بالمعاملات. مثل بيانات مسار النقر على 
الصفحات ومعلومات بطاقة الولاءء مما يتيح بناء ملف مبدي للشخص يمكن البناء عليه مع 
مرور الزمن أو يتم ربطه مع مصادر البيانات الأخرى مثل بيانات التوزيع الجغرافي للسكان. 


(Social Media) |;eLexz V! Lal sl 

قبل :العام ٠0‏ ٠٠م:‏ كانت شسبكة الإنترنت us se Xo JI‏ طا للبت الإغلامق يمكن من 
خلالهاللناس تقديم المعلومات أو شراء البضائع. وكانت هناك e‏ الإغلانات والقوائم 
البريدية التي يستطيع الناس من خلالها التواصلء ولكنها كانت قائمة على استخدام النصوص 
فقطء ومحددة بطريقة عرض بدلا من كونها وسيلة مفتوحة وعامة. وبينما يمكن للأفراد 
إنتاج آشكال أخرى من المحتوى مثل صفحات الويب» إلا آن ذلك يتطلب المهارة لإنشاء 
مثل هذه الصفحات وشراء اسم النطاق» وكانت هذه الصفحات ثابتة إلى حد كبير وينبغي 
تحريرها بشكل رئيسي على الطريقة اليدوية ليجري تحديثها. واعتبارا من العام 6١٠٠م‏ 
وعلى الرغم من ذلك. بدأت طبيعة شبكة الإنترنت بالتغيّر لتصبح أكثر تفاعلية وتشاركية 
ودينامية» وقد تمّ الإشارة إلى هذا التحول على أنه الانتقال من إصدار شبكة الويب الأول 
J! (Web 1.0)‏ الإصدار الاق )2005 (Web 2.0) (O'Reilly‏ . 


وعوضا عن محتوى الويب الذي يجري تقد تقدهه إلى حد كبير من قبل ا مختصين ومصممي 
المواقع الإلكترونيهء فقد أصبح Sy‏ شخص إمكانية إنشاء محتوى مكن تحديثه بشكل 
مستمر. وعلاوة على ذلك. مكن الوصول إلى هذ ال محتوى والتفاعل معه من خلال 
ايد متنوعه من الطنصات مثل الهواتف ASII‏ والأجهزة اللوحية. T‏ من مجرد 
تصفح ا معلومات à5 ol‏ تقييدها في مناقشات ضيقة تنا أصبح من الممكن للناس المشاركة 
بسيولة وبشكل فقال في إنتاج عام الإنترنت وتصميم وتحرير المحتوىء والإسهام بحرية في 
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الخدمات التى تتبادل المواد مع الآخرين. وفي حين تم اعتبار الإصدار الأول لشبكة الويب 
(1.0 اW6)‏ وسطاً للقراءة فقطء فإن الإصدار الثانى لشبكة الويب (2.0 ا۷۷6) هو وسط 
للقراءة والكتابةء هكن للناس من خلاله إضافة قيمة للمواقع عندما يقومون باستخدامها. 

وتميل مواقع الإصدار الثاني من الويب وخدماتها إلى التركيز على النشر من العديد - 
إلى - العديد» والتواصل الاجتماعيء وتوفير معلومات أكثر ثراء واتساقاً. وتشتمل الأمثلة 
على خدمات الشبكات الاجتماعية على سبيل امثال الفيسبوك وتويتر؛ والصور ومواقع 
مشاركة الفيديو على سبيل امثال. فليكر ويوتيوب؛ والمدونات؟ وعمليات المزج باستخدام 
واجهات برمجه التطبيقات ال مفتوحة (41215) لدمج البيانات من مصادر مختلفة لإنشاء 
تطبيقات جديدة على سبيل امثالء فورسكويرء وييلب (م1ا). وتعتمد هذه المواقع كلها 
على المشاركة الفعالة من جمهور متحمس تتبادل ال معلومات حول حياتهم والقيام بأعمال 
من uS‏ الكتابة/التحريرء التظتيقء التعديلء النشرء المشاركة: e ug]‏ التواصلء ... إلخ 
Ui aLi aisg .(Beer and Burrows 2007)‏ فهم لا يتطوعون بالعمل فقطء ولكن 
بالكثيز من البيانات عن أنقسهم» متضمنا ذلك dla se] CoL ALLE‏ الصور, المواقت» الآراء. 
التفضيلات» القيم» وشبكة اتصالاتهم الاجتماعية. ولأنه قد جرى تملك هذه ال مواقع من 
قبل مجموعة شركات تأسست حديثاء فإنه يجري تداول البيانات في أيدي مملوكة للقطاع 
الخاص والتي تسعى بدورها لإنتاج نماذج جديدة من تراكم رأس ال مال عن طريق استخراج 
القيمة منها (انظر الفصلين الثاني والسابع). 


المراقبة الذاتية :(Sousveillance)‏ 

المراقبة الحية هى الرصد الذاتي وإدارة صحة الفرد الشخصية وحياته من خلال التقنيات 
الرقمية الحميمة على سبيل اطثال: معدات اللياقة البدنية. والحوسبة القابلة للارتداء 
لتسجيل اسيانات المتعلقة بالفرد (2003 .21 )© 14131211). وعلى النقيض من اطراقية 
الإشرافية l3 ec (Zl (Surveillance)‏ مراقبة الفرد من موقع خارجى بواسطة شخص 
آخرء يجري توظيف وضبط المراقبة الذاتية عن وعي وإدراك الفرد لتحقيق الذات» وتوفير 
منظور داخلي 5l‏ عن حياته. وعلى مدى العقد الماضيء تطورت حركة المراقبة الذاتية من 
أناس يراقبون ويسججلون بنشاط بياناتهم الشخصية والتي تعرف أيضا باسم حركة القياس 
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الكمّى للذات أو التتبع الذات كميا .)Q ٠١٤1٥4 $٥18‏ وبشكل عام» يراقب الأفراد جوانب 
الصحة واللياقة البدنية. ويجمعون سانات الاستهلاك (على سسل امثالء المواد الغذائية / 
السعرات الحرارية)» والحالات الجسدية (مثل ضغط الدم والنبض).: والحالات العاطفية 
(على سبيل المثالء ا مزاج ومستويات الإثارة) والأداء (على سبيل المثال: أميال المشي/ الركض 
/ الدوران المقطوعة. وعدد ساعات النومء وأنواع النوم).؛ بالتعاون مع عدد من الشركات 
التي تقذم التقنيات والخدمات ال مرتبطة بالمراقبة الذاتية. وتشمل شركات مراقبة الأنشطة 
الرياضية والنوم» على سبيل ال مشال» شركات من أمثال فت بت» ونايك بلس» فيول باند. 
وجوبون )۴tbit, Nike+, Fuelband, and Jawbone)‏ والتی تعمل عای مزامنه البيانات 
الناتجة مع تطبيقات متابعة وتعقب تسمح للمستخدم برصد وتحليل بياناته الشخصية. 
ولا يجري بالضرورة مشاركة البيانات التي تمّ إنتاجها على نطاق أوسع: على الرغم من 
إمكانية حدوث ذلكء ولكن يجري مشاركتها مع الشركات المزؤدة للخدمة: مما يوفر لهم 
اطلاعا نافد كان البياناة)الشخصة! 

وتعد هذه التقنيات في المرحلة الأولى من التطوير وهناك رؤى أكثر شمولا لتسجيل 
(Life Logging) ölə Slo‏ التي تعمل على إنشاء سجل رقمي موحد لخيرات الأفراد. 
من خلال جمع متعدد الطرق عبر أجهزة استشعار رقمية: وتخزينها بشكل دائم كأرشيف 
شخصي متعدد الوسائط )2003 (Mann etal.‏ وذلك مع عدد من نماذج الأبحاث التى 
يجري تطويرها حاليا. وتهدف سجلات بيانات الحياة إلى إنشاء سجل متصلء وقابل للبحث 
والتحليل لماضي الشخص الذي يشمل كل عملء أو كل حدث» آو كل محادثة» JS 9l‏ 
موقع تمت زيارته؛ أو أي تعبير مادي متصّل بحياة الفرد. فضلا عن الظروف الفزيولوجية 
داخل الجسم والأوضاع الخارجية المحيطة به (على سبيل JELI‏ الوجهةء ودرجة الحرارة 
ومستويات التلوث) (2007 (Dodge and Kitchin‏ - "أي مجمل المعلومات التي تتدفق 
خلال حياة الإنسان (85 :2003 (Johnson‏ ومن الواضح أن إنتاج هذه السجلات عن 
الحياة يثير عددا من الأسئلة بشأن الخصوصية. وملكية البيانات المنتجة. وطريقة استخدام 
(Dodge and Kitchin 2007b) «UL! ods‏ 
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:(Crowdsourcing) (2e Ue2J] JJ! 
التعهيد الجماعي هو الإنتاج المشترك لوسائط الإعلامء والآفكارء والبيانات من خلال العمل‎ 
التطوعي من قبل العديد من الناس لحل مهمة معينة. وبينما يمكن القول بأن محتوى وسائل‎ 
التواصل الاجتماعي هي نتاج تعهيد جماعي معنى أنه يتم الحصول عليه من قبل عدد كبير‎ 
من الناسء إلا أن الغرض من هذه المحتوى مورّع وواسع الانتشار ويفتقر إلى التركيز. فبدلا‎ 
من ذلكء يركز التعهيد الجماعي على الإنتاج التعاوني للمعلومات وإنشاء حلول لقضايا معينة‎ 
من خلال الاعتماد على الطاقة: وا معارف. والمهارات: والعمل التوافقي والجماعي لحشد من‎ 
بين (2008) 110176 أن هناك أربعة تطورات تدعم نمو التعهيد‎ 489 .(Howe 2008) Ll 
الجماعي: نهضة الهواة (بحسب المعايير المهنية في الغالب). وظهور حركة البرمجيات مفتوحة‎ 
المصدرء وزيادة وفرة أدوات الإنتاج خارج إطار الشركات ال مصنعة» وصعود مجتمعات محلية‎ 
حيوية ومنظمة وفقا لاهتمامات الناس وميولهم على شبكة الإنترنت» فهذه التطورات‎ 
من تجميع موزع ودمقراطي للأفكار والأدوات والمواد. وهناك ثلاثة أنواع‎ ES مجتمعة‎ 
رئيسنية من التعهيد الْجَماعى التي تعمل في الوقت الخاضر تلك التي تنتج حلا بشكل‎ 
(http://www.openstreetmap.org) e5zàll الشارع‎ dhs p> JLI Jw جماعي على‎ 
ويكسددا (5://1050107.1011216012.01:6]])؛ وتلك التى تستخدم الجمهور لتقييم حلول أو‎ 
(https://www.amazon.com) نوزjامآ منتجات متعددة على سبيل اممثال» موقع شر کة‎ 
التى تسعى إلى حل واحد‎ 55 t(https://www.tripadvisor.com) cx» JI jLZass 
(/https://www.innocentive.com) أو أكثر من الجمهور على سبل المثالء إنوسنتف‎ 

واملتقيات المكثفة مطوري البرمجيات (Hackathons)‏ 


وبخصوص النوع الأول أصبح إنتاج المعلومات (خريطة مفتوحة ا مصدرء موسوعة قابلة 
للتعديل والوصول إليها بحرّية ) تعاونياء وعملا من إنتاج الأفراد. مع إعطاء المشاركين 
الحقوق والتسهيلات لتعديل وتنقيح وإسهاب الشرح لمساهمات الآخرين (861161 
6. فمن خلال العمل عبر شبكة الإنترنت يمكن لأي أحد له قدرة النفاذ إليها من أن 
يسهم ويضيف إلى مجمّع الخبرات المحتملة ونطاق المشاريع مقابل تكلفة آقل» وضمان 
ممارسة مختلف وجهات النظر والتقنيات على المشروع (2011 1ء11120618). وفى الواقع: 
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فإن إنتاج خريطة مفصّلة للعالم أو موسوعة شاملة مع عدد قليل من امهنيين هي مهمة 
صعبة ومكلفة: وببساطة شاقة للغاية بالنسبه لمجموعات صغيرة من المتطوعين. ولكن 
بالنظر إلى آلاف المشاركينء يمكن تجزئة المهمة عليهم وحلها. وسيكون المقابل الذي سيجنيه 
المشاركون هو إنتاج بيانات مفتوحة ا مصدر خالية من حقوق الطبع والنشر والرخص 
Sollo z Jll gs LS) UI‏ الوكالة الوطنية لرسم الخرlثط‏ ( Dodge and Kitchin)‏ 
3). وبالمثلء يمكن لشركة أمازون وغيرها من شركات التجزئة على الإنترنت» من خلال 
تمكين المستخدمين من استعراض امنتجات التي يشترونهاء استخدام قوة الجماهير مراجعة 
ومشاركة آرائهم حول هذه المنتجات. كما أن الفائدة التي تعود على المشاركين هي تبادل 
الرأي فيما يتعلق بالمزايا النسبية للسلع والخدمات. 

ويعد استخدام المسابقات لتحفيز الجماهير على اقتراح حلول مقابل جائزة من أشكال 
التعهيد الجماعي الخاصة والذي تستخدمه بعض الشركات لتقديم الخبرات والأفكار 
e Lass5 .(Weinberger 2011)‏ اللجوء للمناقصات والاستعانة مجموعة محدودة من 
الخبراء امحتملین» تفتح شر کات آمل انوسنتف (TopCoder) gS 59 (Innocentive)‏ 
المشكلة من خلال الإعلان عنها لأي شخص مهتم» وتقدم في العادة من عشرة آلاف إلى مئة 
ألف دولارء وأحيانا أكثر من ذلك بكثيرء لإيجاد حلول لمشاكل العملاء. وهناء يكون الجمهور 
هو مصدر الحلء ولكن لا يعمل الأفراد بعضهم مع بعض بشكل جماعيء وتكون الفائدة 
بالنسبة للشركات هي خيارات الحل المقدمة وللمشاركين هي العائد المالي ]15 3 اختيار 
الحل الخاص بأحدهم. وعلى نحو مماثل» تسعى مسابقات بيانات التطبيقات المفتوحة 
التي تعقدها المجالس البلدية إلى تقديم مكافآت أكثر تواضعا مقابل تطبيقات أكثر فائدة 
وإثارة للاهتمام. ويمكن لهذه المسابقات أن تأخذ شكل الملتقيات المكثفة لمطورى البرمجيات 
)Hackat05(‏ التي يعمل الناس فيها معا في فرق لتطوير حلول تطبيقات» وعادة ما 
تمتد على مدى يوم آو خلال عطلة نهاية الأسبوعء» وتتمثل الفائدة العائدة على البلدية في 
استخدام بياناتها من أجل الصالح العام وشهرة المواطنين: والمشاركة المدنية. 
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علم (Citizen Science) &5l54J!‏ : 
علم المواطنة هو شكل من أشكال التعهيد الجماعي حيث تعمل مجتمعات أو شبكات 
من المواطنين بصفة مراقبين في بعض مجالات العلوم (218 :2007 11نداء6004). هناء 
يقوم الناس بإنتاج وإعداد ومعالجة الملاحظات العملية التجريبية: والقياسات التفصيلية 
للظواهر بالمجانء والتي تعد» حاسمة ومفصلية»ء وذات das‏ حقيقية كنقاط بيانات للعلوم 
الصحيحة. ويكون علماء امواطنة ذوى فائدة بشكل خاص من حيث الرصد لأنهم قل 
يكونون موزعين جغرافيا ومُدرجِين ضهنا في المكان عبر الزمن حيث من الصعب على 
مستويي التنسيق والتكلفة استخدام مساعدي البحوث امهنيين لجمع القياسات اطيدانية. 
ومن الأمثلة على ذلك. قياسات هواة الرصد الجوي الناتجة من محطات الحدائق الخلفية 
للأرصاد الجوية» وهواة علم الفلك الذين يراقون السماء ليلا بدقة. وقد أصبح علم امواطنة 
lici‏ خلال القرن العشرينء. وذلك s‏ لرواج العلم وتعميمه»ء ولكن لا يزال النشاط ضشلا 
ويعتمد على درجة معقولة من اطهارات وا معارف وا معدات المتخصصة مثل مرقاب ذي 

نوعية جيدة» وفوق ذلك قدر كير من التحفيز والالتزام المستمرين. 

وقد .(Bonney et al 2009; cited in Miller-Rushing et al. 2012) àis‏ آشکال 

علم ال مواطنة في ثلاث فئات: 

ale Sio oag (Contributory) 4L. o‏ من قبل العلماء ولأجلها بسهم الأفراد 
عامة بالبيانات ف المقام الآول. 

٠‏ التعاونية (2011300126157)): وتصمم بشكل عام من قبل العلماء ولأجلها بسهم الأفراد 
عامة بالبيانات. ولكن قد يساعدون أيضا على تحسين تصميم المشروع» وتحليل البيانات» 
ونشر النتائج. 

ه الإنشاء ا مشترك :(Co-created)‏ .239 من قبل العلماء وأعضاء من عامة الجمهور 
يعملون معا ولأجلها يته إشراك بعض عامة المشاركين على الأقل في معظم أو جميع 
خطوات العملية العلمية؛ ويشمل ذلك أيضا البحوث التي وضع تصورها وتم تنفيذها 
من قبل علماء هواة (غير مهنيين) بشكل كامل. 
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وق العادة يختلف مسنوی الخيرة ونوع امشاركه ASAI D‏ مع مشاركه اطواطنين 

العلماء فقط من ذوي المهارات الأكثر تقدما في مشاريع الإنشاء ا مشترك. ويمكن أن تتخذ 

المشاركة عددا من الأشكالء بما في ذلك: 

o‏ الحوسبة ال موزعة: حيث يضيف أحد ال مشاركين قوة معالجة حاسوبية من أجهزة الحاسس 
الحاسوبية منها (التساهمية). 

« النسخ / التحويل / الرقمنة: تحويل شكل من أشكال البيانات إلى آخرء على سبيل «JULI‏ 
تحويل وتائق مكتوبه بخط اليد إلى نص رقمي (التساهميه). 

o‏ قياسات الرصد: ينتج العلماء البيانات» ولكن يستخدم علم المواطنة لإجراء القياسات 
باستخدام أدوات محددة يجري تورديدها لهم (التساهمية). 

۰ جمع السانات: يجمع أفراد اطواطنين السانات ومن ثم يقومون ممشاركتها مع العلماء 
(As LJ)‏ 

٠‏ تحليل الرصد: يقوم أفراد ا لمواطنين بإجراء بعض التحليلء بما في ذلك توفير بعض التفسيرات 
ما قد تعنيه النتائج» بدلا من مجرد الاكتفاء بإنتاج أو قياس البيانات (التعاونية). 

٠‏ تصميم البحث وتشغيله: يقوم أفراد المواطنين بدور نشط في تصميم وتشغيل المشروع 
فضلا عن نشر النتائج والاستنتاجات (الإنشاء المشترك). 


(Open Scientist 2013) 


الخلاصة: 

تطرّق هذا الفصل إلى العوامل المساعدة للبيانات الكبيرة ومصادرها. وتم بيان أن إنتاج 
البيانات الكبيرة قد تيسّر بفضل التقاء خمسة ابتكارات تقنية من بدابة الآلفية الجديدة 
فصاعدا وهي تنامي قوة ا معالجة الحاسوبيةء وكثافة التشبيك الحاسوبيء والحوسبة المنتشرة 
والحوسبة في كل مكان» والتعرّف وتحديد الهوية من خلال زيادة قابلية الفرز والقراءة آلياء 
وأخيرا التخزين الموزع الواسع النطاق. وقد أدّتَ هذه التطورات مجتمعة إلى مجموعة 
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الفصل الخامس 


متنوعة من النظم الاجتماعية التقنية التي تنتج البيانات الكبيرة. وقد قدم هذا الفصل 
مسار تتبّع أولي لهذه الأنظمة. حيث قسّمها إلى ثلاث فتات واسعة النقاط من أشكال إنتاج 
البيانات: امموجهة» والالية. والتطوعية. وينبغي النظر إلى مثل هذا ا مسار باعتباره خطوة 
أولية في محاولة وضع خريطة لمشهد يتكشّف باستمرار. وما هو مطلوب حالياً يتمثل في 
مجموعة مفصّلة من الدراسات التجريبية التي تدرس بشكل أكثر عمقا الطرق المختلفة التي 
يتم بها حاليا إنشاء ومعالجة واستخدام البيانات الكبيرة. كما تحتاج مثل هذه الدراسات 
إلى رسم أصول التقاء هذه التقنىات الممكنة وفك مجاميع البيانات التي تم م أنشاؤها وكيف 
تطبق Llas‏ لإنتاج أشكال معينة من البيانات الكبيرة (انظر الفصلين 1 و11). وهذا يشمل 
تفكيك عناصر النظام المرتبط بها (انظر الفصل 7). وعند القيام بذلك؛ يمكن الحصول على 
أفكار ورؤى أكثر عمقا لكل نظام اجتماعي تقني ومختلف العمليات والضوابط والسياسات 
المتصلة به: والعمل المتنوع الذي يقوم به في هذا العام. 
كما بس ين ادر کک 
النظم الاجتماعية التقنية معا لإنشاء أنظمة جديدة أكبر والتي من خلالها تنتج الآثار 
الهامة لتضخم البيانات. كما أن التقنيات التي تقوم عليها البيانات 854571( والبيانات 
نفسها من خلال علائقيتها. هى TT‏ جاهزة لمثل هذه التوسعات. ف الواقع:. تكون 
مجاميع اجتماعية تقنية (63s (Socio- T‏ مثل سلسلة متاجر التجزئة 
الكبيرة كوومارت (Walmart)‏ ; تقوم تقوم وعلى نحو متزايد. بربط العديد من الأنظمة 
JaLdas5 «(Supply Chain Management) 4532! 4L Lo 8513! (zs‏ موارد 
Customer) hal Sbe öylol (Enterprise Resource Planning) «UL whl‏ 
(Relationship Management‏ إدار ô‏ المخز à bla (Store Management) js‏ 
(Security Systems) =‏ والتي تنتج ج أشكالا من السانات الموجهة: والاللة» والتطوعية 
نشاء منظمات معقدة ومتطورة موجهة بالبيانات والتي تترتب عليها اثار متنوعة على 
a‏ واموظفين والملستهلكين. وباطثلء. تحاول مراكز السيطرة والتشغيل للمدن 
الذكية دمج أنواع مختلفة من البيانات التي تم جمعها من مصادر مختلفة في مركز 
واحد حيث يتم الجمع بينها وتحليلها بشكل انىي أو z% l (Real-Time) „hod‏ 
بشكل جذري الطريقة التي تدار وتحكم بها التجمعات المدنية (انظر الفصل السابع). 
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وقد أثار مثل هذا التوسع وإعادة الضط العديد من الأستلة الاجتماعية والسباسية 
والأخلاقية والمعيارية المتعلقة بأنواع الأنظمة والأماكن التي نريد العيش داخلهاء وقد 
بدأنا بالكاد أن نسأل ونجيس عن هذه الأسئلة (انظر الفصل العاشر). 
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الفصل السادس 
آليات تحليل السسانات (411217015 12262) 


ليست البيانات بحذد ذاتها مفيدة: كما أنها لسست ذات فائدة إلا إذا أمكن استخلاص 
معنى وقيمة منها. وبعبارة أخرىء فإن ما يمكن فعله حيال البيانات هو أمر أهم من مجرد 
عملية إنتاجها؛ إذ ترتكز جميع العلوم على تحقيق معنى وقيمة من البيانات. إن إيجاد 
واستشعار ال معنى من البيانات الصغيرة الموسّعة والبيانات الكبيرة ينطوي على تحديات 
جديدة. ففى حالة البيانات الصغيرة الموسعة. يكمن التحدي في ربط قواعد البيانات 
المتنوعة للحصول على رؤى جديدة. وانفتاح البيانات لتقبل المناهج التحليلية الجديدة 
التى يجري استخدامها مع البيانات الكبيرة. أما بالنسبة للبيانات الكبيرةء فيتمثل التحدي 
في التكيّف مع الوفرة والشمولية (متضمنا ذلك الكميات الكبيرة من البيانات ذات الفائدة 
والقيمة المنخفضة).؛ وامناسبة الزمانية والديناميكية: والفوضى وعدم اليقينء والعلائقية 
العالية: والطبيعة شبه ال منظمة وغير ا منظمة. وحقيقة أن يتم إنتاج الكثير من البيانات 
الكبيرة دون أي سؤال محدد في العقل لتجيب عنه أو أنها في صحبة منتج هو نتيجة ثانوية 
لنشاط آخر. فالواقع» وحتى وقت قريبء تم تصميم تقنيات تحليل البيانات بشكل أساسي 
لاستخلاص رؤى من مجموعات بيانات شحيحة. وثابتة. ونظيفة. وضعيفه العلائقيه» وجرى 
جمعها بطرق علمية وملتزمة بافتراضات صارمة مثل الاستقلاليةء والثبات» والعيارية» كما 
جرى إنتاجها وتحليلها مع وضع سؤال محدد ف الاعتبار (2010 2111168 .[.11). 

حتى وقت قريب كان تطوير أدوات للربط بين مجموعات البيانات المختلفة وتحليل 
البيانات الكبيرة ضغيفا؛ بسبب التعقيد المرتبط بتطوير هذه الأدوات من الناحية 
الحاسوبية. وم يجر تحليل مجموعات البيانات الضخمة بشكل منتظم سوى فى السنوات 
الأربعين الماضية أو عبد ذلك. وحتى ذلك الحين كانت هذه التحليلات dél‏ على مبادرات 
خاصة قادرة على تحمل اموارد اللازمة. وبدون طاقة حاسوبيه عالية واسعهة الانتشار 
ويمكن النفاذ إليها سيكون إيجاد واستشعار المعنى من طوفان البيانات الهائل مكلفا 
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للغاية أو صعب التطبيق ويستغرق وقتًا طويلا. وبالطبع» هناك نوع ما من الجدل الدائر 
في الواقع هنا؛ إذ دون الحوسبة الواسعة الانتشار في كل مكان لم يكن إنتاج البيانات الكبيرة 
ليكون في المقام الأول. ومع ذلك. كما ذكر JI ,Jb «3$ .Hastie et al. (2009: xi)‏ 
«ظهور الحواسيب وعصر ال معلوماتء فقد تفاقمت المشاكل الإحصائية من حيث الحجم 
والتعقيد». 

وتمثل الحل لتحديات معالجة وتحليل البيانات الصغيرة الموسّعة والبيانات الكبيرة 
مجموعة جديدة من آليات إدارة المعلومات والتخزين (انظر الفصل الخامس) وتطوير 
أدوات تحليل البيانات الكبيرة. فمنذ بداية الحوسبة استمرت هذه الآليات والأدوات 
التحليلية الجديدة في التطور» وهي تقوم على اختبارات إحصائيةء ونماذج» وأساليب تمثيل 
صوري رصينة متبعة» كما أنها تعمل على إنشاء أساليب وطرق جديدة تضرب جذورها 
في البحوث المتعلقة بالذكاء الاصطناعي والآنظمة الخبيرة التي هدفت إلى إنتاج تعليم 
الآلة بحيث يممكنها حاسوبيًا وبصورة تلقائية التنقيب» والكشف عن الأنماطء وبناء النماذج 
التنبئية. فمثل هذه الأدوات التحليلية أضحت ملائمة وبشكل مثالي في معالجة واستخلاص 
المعلومات من مجموعات بيانات ضخمة ومتصلة سعضهاء فقد أصحت تشغل حيزا 
كبيراً من الاستثمار في البحوث من أجل توسيع وإنتاج طرق معالجة جديدة للبيانات 
والخوارزميات الإحصائية والنمذجة وتقنيات التمثيل الصورية (المؤسسة الوطنية للعلوم 
Science Foundation 2012‏ اNationa).‏ وتسعى هذه الآدوات التحليلية: كما هي 
مطبّقة في مجال الأعمال التجارية والعلوه: للإجابة عن أربع مجموعات أساسية من 
الأسئلة )2013 :(Minelli et al.‏ 


e‏ الوصف (Description)‏ ماذا ومتى حدث ذلك الشيء؟ وكم مرة يحدث؟ 
ه التفسير ISU :(Explanation)‏ حدث ذلك؟ وما هو تأثيره؟ 
e‏ التنشؤ (21601]1011): ماذا مكن أن يحدث بعد ذلك؟ وماذا لو فعلنا هذا أو ذاك؟ 


o‏ العلاج :)Prescription(‏ ما الحل أو النتيجة المثلى؟ وكيف مكن تحقيق ذلك؟ 
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وتستمد الإجابة عن هذه الأسئلة من أربع فئات رئيسة من آليات التحليل: التنقيب عن 
البيانات والتعرّف على الأماطء التمثيل الصورى للبيانات وآليات التحليل البصرية: التحليل 
الإحصائيء والتنبؤ والمحاكاة والتحسين. وسيتم مناقشة كل من هذه الفئات باختصارء ولكن 
ينبغي تقديم مرحلة ما قبل التحليل وتعلم الالة Yol‏ لآنها مركزية لجميع الفئات الأربعة. 


ما سبق التحليلات (2112176125-ع21): 
تحتاج كل تحليلات البيانات إلى أن تكون البيانات المطلوب تحليلها معدّة سلفا للتحليل؛ بمعنى 

أنه قد جرى تجهيزها والتحقق منهاء وقد بين (2011) H.J. Miller (2010) and Han et al.‏ 

أربع عمليات فيما يتعلق بالبيانات الموسّعة والكبيرة والتي تطبّق عادة بالتسلسلء على الرغم من 

أنه لا يلزم تنفيذها بأي ترتيب معينء إضافة إلى إمكانية تكرار تنفيذها: 

e‏ اختيار السيانات (6102ء5616 103]8): تحديد مجموعة جزئية من المتغيرات الأكثر قيمة: 
وإطار العينة المحتمل لهذه المتغيرات. حيث لن تكون كل ال متتغرات الناتجة ذات 
أهمية. ولا بالضرورة كل نقاظ البيانات» فإدراج مثل هذه البيانات غير الضرورية في 
نماذج قد Js;‏ التكرار وعدم الكفاءة. 

o‏ امعالجة المسبقة للسانات (216-21066551115 103163): تنظيف البسانات ال مختارة لإزاله 
الضوضاء أو الأخطاء أو التحيّزء أو التعامل مع الحقول المفقودة أو التناقضات وعدم 
السلامة» وهيكلة البيانات لإدخالها في عملية التحليل. 

٠‏ اختزال السانات وإسقاطها (”ecti0زproj :)Data reduction and‏ التقليل من أبعاد 
السانات من خلال التحويلات (على سسل اطثال. التسوية والصقل (Smoothing)‏ 
وبناء السمات والخصائصء» والتجميع» والتطبيع: والتسلسل الهرمي للمفهوم: والأساليب 
الإحصائية مثل تحليل مستوى الانحدار وتحليل المكونات الرئيسية) لمكافأة تمثيل 
البيانات ولكن بصورة أكثر كفاءة. 

ه إثراء البيانات (01161126126»© 1038): دمج البيانات المختارة مع بيانات أخرى (مثل 
بيانات التعداد السكاني وبيانات السوق) من أجل الوصول إلى رؤى يمكن الاستفادة منها 
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da> jad‏ صمّمت كل خطوة من هذه الخطوات من أجل زيادة نوعية السانات 
المستخدمة في التحليلء ومن جهة أخرىء باستثناء إثراء البيانات. من أجل تقليل حجم 
البيانات التي على التحليل التعامل معها. فالأول تم تصميمه لتعزيز صحة وصلاحية 
الاستنتاجات ال مستخلصة بالنظر إلى الفوضى الكامنة وعدم اليقين ق البيانات الكبيرة (انظر 
الفصل التاسع). في حين يهدف الثاني إلى زيادة الكفاءة التشغيلية مع الأخذ بعين الاعتبار 
أحجام البيانات وسرعاتها والأحمال الحاسوبية. ومن الممكن أن يكون من الصعب القيام 
بهذه المهام عند إجراء التحليلات بشكل آني أو Jod‏ « وخاصة فيما يتعلق بتنظيف البيانات. 
ونتيجة لذلك» وفيما عدا التمثيل الصورى للمؤشرات» لا يجري تحليل البيانات الكبيرة آنيا 
أو بشكل لحظي» ولكن يجري التحليل على سلاسل تمثل عينات كبيرة جدا لبيانات نظيفة: 
ومختزلة. ومخصّبة (ثرية) وخلال أزمان مختلفة. أما إذا كان المطلوب تحليلات بشكل I‏ 
أو لحظي: فتطبّق في العادة التحليلات المسبقة للبيانات مقدمًا على عينة من أجل تحديد 
طبيعة السانات وكيفية التعامل معها للانتقاء. والاختزالء والتنظضف على عجل. 

ويعد إثراء السانات مهمة ذات aö‏ عالية لأنها تنتج ]5^ ا Crampton et al.)‏ 
2 ممكن من اكتساب رؤى لا مكر الحضول عليها من خلال قاعدة بنانات واحدة. 
وبحسب من تمت مناقشته في الفصل الثاني فإن المبرر الرئيسي لإنشاء البنى التحتية 
للبيانات تمثل في إعادة استخدام البيانات. وإن التحدي يتمثل في إنشاء طرق لربط البيانات 
التي أنتجت لأغراض مختلفة بعضها ببعضء والتي قد تختلف أيضا في البيانات الوصفية 
المصاحبة لهاء ومعابر البيانات» ووحدات القياسء والإجراءات» والفئات» والنطاق» والتزامنء 
وتنسىقات الملفات» أو إنشاء طرق للربط لتقليل حدوث ال مغالطات ال محتملة الناتجة عن 
Ecological Fallacies) JV AVI‏ 20661131 01 1631011)). وهذه لست dago‏ يسيرة. 
ولكن تعمل الأساليب الحاسوبية على جعلها أسهل من خلال استخدام الخوارزميات التي 
مكنها البحث» اممطابقةء الدمج إعادة الجمع من خلال أنواع مختلفة من التحولات» وإعادة 
تهيئة البيانات. وبالنتيجة. يمكن التنقيب والتحليل في مجموعة بيانات جديدة باستخدام 
الفئات الأربع الرئيسية للتحليلات التى سيجري نقاشها أدناه. 
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ويمكن أن تكون أعمال التحليلات المسبقة مملة باستغراقها وقنّا طويلا «ulis‏ ولكنها 
مع ذلك مهمة جذا ولا يمكن تجاهلها. وبالنظر إلى الزيادة المنقطعة النظير في مختلف 
أنواع البنى التحتية الجديدة للبيانات والبيانات الكبيرة» فقد أصبحت منطقة ثرية للبحث 
حيث يسعى علماء البيانات إلى إيجاد طرق أكثر إنتاجية وكفاءة وفعالية لإتمام. وخصوصا 
أتمتة. هذا العمل. 


تعليم الآلة أو التعلم :(Machine learning) ,, yl‏ 

يمكن إجراء تحليل الأعداد الكبيرة جدا من سجلات البيانات في إطار زمنى مناسب عن 
طريق الخوارزميات الحاسوبية. وفي حين أن الكثير من عمليات تحليل البيانات الكبيرة 
يمكن إجراؤها بالطرق نفسه المتبعة في تحليل البيانات الصغيرة. حيث يتخذ المحللون 
القرارات المتعلقة بالكيفية التي يتم فيها الاستكشاف من خلال هذه الخوارزميات» فإن 
الهدف من أغلب البحوث هو تطوير عمليات مؤتمتة ممكنها تقييم السانات والتعلم منها 
ومن تحليلها. ويطلق على هذه العمليات المؤتمتة مصطلح تعلم الآلة أو التعلم الآلى 
وتشكل أحد فروع الذكاء الاصطناعي. ويهدف تعلم الآلة إلى التطوير المتكرر لفهم 
مجموعة البيانات؛ والتعلم التلقائي لإدراك أنماط معقدة وبناء نماذج توضح وتتوقع مثل 
هذه الأماط؛ وتحسين النتائج (2011 (Han et al.‏ 


ويتكوّن تعلم الآلة بشكل عام من نوعين رئيسيين: مُراقب (باستخدام بيانات التدريب) 
وغير مراقب (باستخذام التنظيم الذاق). ف التعلم المراقب» يقم تدريب نموذج لمطابقة 
المدخلات مع مخرجات معلومة. على سبيل امثالء ممكن تدريب النموذج لمطابقة الرموز 
البريدية المكتوبة بخط اليد مع مثيلاتها ا مطبوعة آليّا أو التنبؤ بنتائج معينةء فهي «مراقبة» 
بمعنى أن بيانات التدريب موجودة لتوجيه عملية التعلم )2009 à. .(Hastie et al.‏ المقابل: 
تسعى نماذج التعلم غير الخاضعة للرقابة إلى تعليم نفسها على اكتشاف الأنماط وإيجاد هياكل 
البيانات دون استخدام بيانات التدريب. وبشكل عام» مكن تحقيق ذلك من خلال تحديد 
مجاميع وعلاقات بين البيانات التي مم يكن معروفا بينها مسبقا خصائص للتشابه أو الارتباط. 
فعلى سبيل المثالء يمكن أن يتعلم النموذج على كيفية تقسيم العملاء إلى مجموعات ذاتية 
متمائلة والتنبؤ بالمشتريات لتلك المجموعات (2011 .21 :© 1132). EIS à‏ الحالتين» يتم 


تورة البيانات البيانات الكبيرةء والبيانات المفتوحة: والبنى التحتية للبيانات» والنتائج المترتبة عنها VAY‏ 


AA 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  QM ECONLIBRARY‏ 


الفصل السادس 


إنشاء نموذج من خلال عملية التعلم التي شكلتها القواعد والأوزان التي توجه كيفية slu‏ 
مموذج فيما يتعلق بالبيانات (2009 .21 ]© 1135]16). وتبدا عملية بناء نموذج من بناء بسيط 
ثم يتم التعديل مرارًا وتكرارًا على ذلك البناء باستخدام قواعد التعلم» بالمثل كما يُطبق مع 
الطفرات JI duol‏ أن يتطور البناء إلى نموذج قوي )122 :2013 Jas .(Siegel‏ شکلان 
للتعلم امراف وغير ا مراقف وهما التعلم شبه المراقف الذي يشتمل على استخدام کل من 
التدريب والبيانات التي لا تحمل عناوين (وهي البيانات التي يمكن الحصول عليها بسهولة 
ولكنها غير مسماة كالصور والتسجيلات الصوتية: والفيديوء المقالات الإخباريةء وغيرها من 
البيانات الخالية من أي ملصقات تتيح التعرف عليها بشكل أكبر): والتعلم النشط الذي يتيح 
للمستخدمين القيام بدور نشط في توجيه نموذج التعلم (2011 (Han etal.‏ 

وقد جرى استخذام التعلم الآلي في جميع عمليات تحليلات البيانات الكبيرة الأربع: 
على الرغم من أن هذه التحليلات ليست مقتصرة في عملها على هذه الطريقة. ويتم 
إجراؤها. في كثير من الحالات. من قبل الباحث بشكل مباشرء وحتى ضمن التعلم الالى. 
يبقى'الْلْحَلَلٌ وذوره 6 في الحكم على العملية وتوجيهها وتقييم النتائج الوسيطة. وكما 
os H.J. Miller (2010) JÀ —V‏ التعلم الال ليس مجرد علم تلقاني وسهل اطنالء بل 
ات 555 là as $35 Jio‏ وهي اطهارات التي لا يزال العقل البشري أفضل بها من 
أجهزة الحاسب الآلي. وبينما تم إحراز تقدذم كبير في تطوير تقنيات التعلم «VI‏ فإنه لا 
يزال من العلوم الناشئة التي مازالت بحاجة إلى الكثير من البحث لتحسين فعالية ومتانة 
النماذج المنتجة. 

وفيما «Jo‏ سيتم مناقشة كل فئة من فئات التحليلات الرئيسية على حدةء على الرغم 
من أنه تجدر الإشارة إلى أنها غالبًا ما تستخدم جنبًا إلى جنب. على سبيل المثال» ينبغي أن 
يوفر التنقيب عن البيانات والتعرف على الأنماط أسس التنبؤ/التوقع أو التحسينء ويمكن 
استخدام الإحصاءات في التنقيب عن البيانات للكشف عن الأنماط أو في حساب التوقع/ 
التنبقؤ وقد يستخدم التمثيل الصوري في التنقيب عن البيانات» أو لتحصيل المخرجات من 
أنظمة المحاكاة... إلخ. 
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التنقس عن السانات والتعرّف على الأنماط :(Data Mining and Pattern Recognition)‏ 

التنقيب عن البيانات هي عملية استخلاص البيانات وأنماط من مجموعات البيانات 
(Manyika et al. 2011) 5,1 5JI‏ ويقوم التنقس عن اليانات على مفهوم امتلاك كل 
مجموعات البيانات الضخمه معلومات مفيدة ذات معنى على صورة غير عشواتية. وذات 
صلاحية سارية ا مفعولء وقابلة للرواية: 624225( ومفهومة في نهاية المطاف Han et)‏ 
1 .31). وبالمثلء: يستخدم التعلم الآلى المراقب وغير المراقب للكشف والتصنيف 
والتقسيم عن العلاقات والارتباطات والاتجاهات ذات ال مغزى بين المتغيرات. وهي تقوم 
بذلك باستخدام سلسلة من التقنيات بما في ذلك معالجة اللغات الطبيعية. والشبكات 
العصبية. وأشجار اتخاذ القرارء والأسالي الإحصائية (دون معاملات وذات المعاملات). 
وتختلف طريقة الاختيار بين نوع البيانات (المنظمة: وغير المنظمة: وشبه المنظمة) والهدف 
من هذا التحلل (انظر الجدول١‏ — (( 


الحدول رقم Y)‏ - 1( 
مهام وأساليب التنقيب عن البيانات 


مهمة التنقيب عن البيانات الوضف 


التجزئة أو التجميع تحديد قانمة من اللمجموعات التحليل العنقوذدي (Cluster Analysis)‏ 
Segmentation or)‏ الضمنيه التى تصف البيانات 
(Clustring‏ 





(Classification) Linai]‏ التنبؤ باسم الفئه التي تنتمي تصنيف النظرية الافتراضة 
إليها مجموعة من البيانات 

ااا ای تی مات 

aca ja3ll bL.‏ استقراء شجرة القرارات 


(Bayesian Classification) 


(Decision Tree Induction) 


aS JI d sas) الشيكات‎ 


(Artificial Neural Networks) 


الة دعم التمييز 





(Support Vector Machine) 
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(Association) Ja» Jl‏ إيجاد روابط بين كائنات قوانين الارتباط 
السانات؛ gail‏ بقيمة بعض 
الحقول بالاعتماد على قيمه 

حقول أخرى 


(Association Rules) 


تصنيف النظرية الافتراضية 
(Bayesian Classification)‏ 
الانحراف (Deviation)‏ إيجاد عناصر السانات التحليل العنقودي 
امعرضه للانحراف عن 
امتوقع 


(Cluster Analysis) 
كشف الانحراف‎ 
(Outlier Detection) 
تحليل التطور‎ 
(Evolution Analvsis) 
(Regression) jla25VI الاتحاهات (11105) الاتجاهات وال منحنيات التى‎ 

تلخص قواعد السيانات» عادة 


عبر الزمن 


استخلاص تسلسل التمظ 


(Sequence Pattern Extraction) 


(Generalization) gasil‏ | دمج مواصفات البيانات القواعد والقوانين الموجزة 


(Summary Rules) 


( Attribute-Oriented Induction) 





(Miller and Han (2009: 7 : ;..aLl 


إن معظم الآليات المدرجة في الجدول (6-1) تتصل بالبيانات المنظمة كتلك الموجودة في 


قواعد البيانات العلائقية. على سبيل JULI‏ من ال ممكن تطبيق نماذج التجزئة على قواعد بيانات 
عملاء التجزئة ومشترياتهم لتقسيمهم بحسب معرّفات مختلفة بالاعتماد على خصائصهم 
وأنماط سلوكهم من أجل تقديم عروض/ خدمات مختلفة لكل مجموعة مختلفة. وف تحليل 
الشبكات الاجتماعية» يمكن تحليل الروابط بين الأفراد لفهم المتغيرات الاجتماعية وكيفية تدفق 
المعلومات فيما بينهم. وفي كشف الارتباطاتء يمكن استخدام مجموعة متنوعة من نماذج 
الانحدار في الكشف عن الروابط لحساب الاقترانات بين المتغيرات: ومن ثم الكشف عن الأنماط 
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الخفية التي يمكن الاستفادة منها لتحقيق مكاسب تجارية (على سبيل المثال» تحديد ما يتم 
شراؤه كوحدة من البضائع وإعادة تنظيم ال مخزون لتعزيز الشرائية) (انظر الفصل السابع). 

وتثير البيانات غير المنظمة» والتي تكون على شكل نصوص أو صور أو أصوات. تحديات 
خاصة فيما يتعلق بالتنقيس عن البيانات. فاليات معالجة اللغات الطبيعية تهدف إلى 
تحليل اللغة الإنسانيه التي يجرى التعبير عنها من خلال الكلمه ا مكتوبة والمنطوقة. وهي 
تستخدم دلالات وتصنيفات من أجل التعرّف على الأنماط واستخراج ال معلومات من الوثائق. 
وتشتمل الأمثلة على استخراج العنصر الذي يستخرج البيانات الوصفية من النص بصورة 
تلقائية من خلال البحث عن أنواع معينة من النصوص والتعابير. مثل أسماء الأشخاص 
وامواقع والتواريخ والمصطلحات التخصصية والتراكيب ال منطقية؛ واستخراج العلاقات التى 
تحدد تلقائيًا العلاقات بين العناصر الدلالية: وربطها معا (على سبيل المثال» اسم الشخص 
وتاريخ ميلاده أو مكانه. أو رأيه ببند ما) (2009 (إ1ه8160016). ومن التطبيقات النموذجية 
لمثل هذه الآليات التحليل الوجداني الذي يسعى إلى تحديد الطبيعة العامة للآراء وقوتها 
حول قضية ماء على سبيل امثالء ما يقوله الناس عن انتج على وسائل التواصل الاجتماعي. 
كما مكن تعقب أماكن نشوء هذه الاراء باستخدام البيانات الوصفية الموضعية (1811212) 
(etal. 3‏ والتنقيب عن نشر المعلومات داخل وسائل التواصل الاجتماعي» على سبيل 
gle Jols JELI‏ المواقع الإلكتزونية الأكثر تفضيلا ومُشتاركتها بين مختلفة المستخدمين 
.(Ohlhorst 2013)‏ فهذه المعلومات مفيدة للشركاتء. مثل الوكالات الإعلانية. وامسوقين: 
والخدمات المالية» والتىي تسعى إلى الاستفادة من الاتجاهات الناشئة والوصول المنظم في 
الوقت المناسب (على سبيل امثال» لوضع إعلانات تتناسب مع الأحداث الجارية؛ لبيع وشراء 
الأسهم قبل ردة الفعل العنيفة للسوق). 

.)0 110156 2013( الصور فيتم إنشاؤها للتخزين والعرضء وليس للمحتوى والبحث‎ Ls 
فكشف وتصنيف واستخراج أنماط داخلهاء مثل التعرف على الوجه أو مكانء. ليس بالأمر‎ 
السهلء ولكن يتم التعامل مع ذلك من خلال تقنيات ال مسح التصويريء والاستشعار عن‎ 
الاشسعتصار الآلة. :متضمنا ذلك التغرق غلن الأفياء ومطادقة‎ OUS ومغالحة الضور‎ «Aso 
القالب باستخدام مجموعات التدريبء وطرق التجميع: والشبكات العصبية. وتتفاقم‎ 
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مشكلة التنقيب ف الصور عند محاولة استخراج» ومقارنةء وفهرسة الأماط لعدد هائل من 
الصور (2001 .21 ]© 7123118). وبرغم أن التنقيب فى الصور لا يزال من اممواضيع الناشئهء 
إلا أنه أصبح أكثر تقدمًا في السنوات الأخيرة. فعلى سبيل JELI‏ فإن الموقع الإلكتروني 
على شبكة الإنترنت: o£% (http://imagevision.com)‏ بأنه سيكون قادرا على تصندف 
0 دقيقة من الفيديو في الساعة الواحدةء لكل خادم» وذلك باستخدام خوارزميات 
التعلم الاي للكشف عن بعض الخصائص مثل العري وشعارات الشركات. 

التمثيل الصورى للبيانات وآليات التحليل الصورية Data Visualisation and)‏ 
:(Visual Analytics‏ 


شاعت مقولة تنص على أن صورة واحدة تغني عن ألف كلمة. وبامثلء جرى استخدام 
ال 1L iio‏ #الفيووضف مجموغات السانات مزيةقة ‏ المققطات والرسومفات 
الإحصائية» والرسوم البيانية» والخرائط» والرسوم المتحركة. وتكشف هذه الأساليب البصرية 
وتوصل على نحو فعال هيكل المتغيرات. وأنماطهاء واتجاهاتهاء والروابط بينها. وبالنظر إلى 
الحجم الهائل للبيانات الكبيرة وسرعتهاء فليس من المستغرب إذا أن التمثيل الصوري قد 
صار وسيلة شعبية لاستشعار البيانات وإيصال هذا الشعور. 


ويمكن استخدام التماثيل الصورية الناشئة ضمن عاط التقنية الرقمية للتنقل والاستعلام 
عن البيانات, مما يتيح للمستخدمين الحصول على aod‏ عامة عن كامل مجموعة البيانات. 
بالتركيز على البنود المهمةء واستبعاد البيانات غير المهمة. واختيار عنصر بياني أو مجموعة 
من البيانات والحصول على مزيد من التفاصيل» وعرض العلاقات بين العناصرء واستخراج 
مجموعات فرعبية من التفاصيل عند الحاجة (1996 512116106111121). وعند عمل ذلك. مكن 
الكشف عن خصائص وبنية مجموعات البيانات» وأكثر من ذلك يمكن استخدامها لتوضيح 
وفهم النماذج ومجموعات البيانات المعقدة التي يتعذر تمثيلها بطريقة مجردة وواضحة 
ومفهومة (مثل الظواهر الذريةء والظواهر الفلكية الثلاثية الأبعاد)» ورسم عشرات الآلاف 
من نقاط البيانات للكشف عن البنية» والتجميعات» والثغرات» والقيم الشاذة التي قد تظل 
بدلا من ذلك مجهوله ق الخفاء (1996 ۸٣۲ء14٤"‏ 51). على سبیل امثالء استيعاب وفھم 
ملايين التغريدات على شبكة التواصل الاجتماعي تويتر ليست بمهمة سهلة: فيمكن للمرء 
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الحصول على فكرة تقريبية عن القصص أو المواضيع التي تبدو واعدة. ولكن الحصول على 
نظرة عامة وشاملة هي مهمة غاية في الصعوبة. وكيفية تغير التوجه على مستوى الجماهير 
والأماكن. فأحد الحلول يتمثل في رسم خريطة تغريدات موزعة جغرافيًا ومصنفة بحسب 
الميول والأهواء. وهو نهج جرى الأخذ به من خلال فريق عمل الموقع الإلكتروني http://)‏ 
sä) .(floatingsheep.org‏ أنشؤوا عشرات الخرائط حول توجهات المواضيع والتغريدات» 
واشتمل ذلك على الشكل ١(‏ - 1) والذي يعرض التوزيع الجغرافي لتغريدات التخوف من 
ا مثليين في الولايات المتحدة من يونيو 7١١7‏ م وحتى إبريل ٠١١١‏ م. كما أنهم عرضوا 
محتوى موسوعه الويكيبيديا وجوجل بالنسبه لمواضع التوزيع الجغرافي حول العام. 

ويشيع استخدام التمثيل الصوري أيضا ليكون وسيلة للمراقبة الآنية المستمرة لظاهرة 
ما بشكل آني أو لحظي» مما يتبح تعقب ورصد العديد من المتغيرات عبر الزمان والمكان: 
وامقارنة بينهاء وتحديد التغيير الحاصل. فلوحات التحكم (Dashboards) blg‏ 
للبيانات المتغيرة تكون غالبا معروضة على شاشات الحاسب الآلى في غرف التحكم الحديثة, 
وهی تلخص على نحو صوري الأنظمة المتغيرة باستمرار للمشغلين الآدميين. مع سلاسل 
زمنية ورسوم ببانية وخرائط للكشف عن الأحداث (انظر ليك 2013 .Lake‏ للمقارنة بين 
7 لوحة عرض). وعلى سبيل «JUL‏ ممكن أن ej‏ البيانات من مختلف أنحاء نظام النقل 
خريطة لتدفق حركة ال مرور وتقارير الحوادث بشكل آني أو لحظي؛ أو مواقع الطائرات 
خلال مروزها غير مفنطقة ما'(انظر الشكل 1-7): كما قد توفر ننانات رادار الظكّس خريطة 
لهطول الأمطار بشكل آني أو لحظي ومحاكاة للساعات القليلة ا ماضية. فمثل هذه البيانات 
الصورية لا تساعد ضباط إدارة حركة المرور والراصدين الجويين فقطء ولكن أيضا المواطنين 
الذين يمكنهم الوصول إليها ومتابعة الأوضاع الجارية باستخدام الحاسب الآلىي أو الهواتف 
الذكية وتبديل سلوكهم لتجنب طرق معينة أو التعامل بشكل مناسب مع ال مستجدات. 
ومثال على نموذج أولى للوحة تحكم خاصة مدينة عامة تضم مجموعة من البيانات الآنية 
أو اللحظية عن الطقس.ء وتلوّث الهواءء ومعوّقات حركة مرور النقل العام: وتوافر الدراجات 
العامة ومستوى ارتفاع المنسوب اماف النهريء وارتفاع الطلب على الطاقة الكهربائية, 
وسوق الأوراق الماليةء واتجاهات التغريدات على شبكة التواصل الاجتماعي تويترء وتغذية 
كاميرات مراقبة حركة المرور تلك المعروضة ف الشكل .)١-۳(‏ 
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الشكل رقم ١(‏ -5) 
التوزيع الجغرافي لتغريدات التخوّف من امثليّة في الولايات المتحدة الأمريكية 
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آلبات تحليل السيانات 


ومن الممكن أيضا استخدام التمثيل الصوري كشكل من أشكال الاستنتاج التحليلي. 
وهناءلا يصف أو يعرض التمثيل الصوري مجرد البيانات فقطء ولكن يجري استخدامها 
أداة تحليلية. ويتم توجيه هذه الطريقة: والتي يطلق عليها مصطلح التحليلات الصورية. 
في الغالب بواسطة مجموعة من الأشخاص والخوارزميات التي تعمل باتساق لاستخراج 
البياناتء وبناء النماذج البصرية وتفسيرهاء والمضي قدما في المزيد من التحليل الإحصائي 
.)Keim e 21. 2010(‏ لقد آصبحت آليات التحليل البصرية مجالا luasg las‏ من 
مجالات البحث» وهو الأمر الذي أسهم في تطوير حقل التمثيل الصوري للمعلومات من 
خلال دمج عناصر التنقيب عن البيانات. وعلوح الإحصاء والإدراك Thomas and Cook)‏ 
6 فالعديد من أنواع الرسومات البصرية ال مختلفة شائع الاستخدام» وهى في العموم 
تفاعلية وتتيح للمستخدم التعامل معها والتلاعب في الصور من أجل البحث والكشف 
عن الأنماط والروابط. وبالإضافة إلى ذلك. فإن الشاشات ال معروضة للمستخدم متصلة 
ببعضها في الغالب بحيث إن التفاعل مع إحداها ينعكس على الأخريات: مما يمكن من 
تفخص جوانب من الببانات من آكثر من منظور واحد فى ذات الوقت. فعلى سبيل امثال. 
يعرض الشكل )1-٤(‏ أنواع SLT‏ التحليل الصورية المتاحة ضمن أدوات آليات التحليل 
الصورية (817). ا موضوعة من قبل ال مركز الوطني للتحليلات الجغرافية الصورية في 
(Linkóping University) ez55$.5 4 slo‏ في السويد. بالإضافة إلى توفيرها مجموعة 
مق الأدوات التحليل. 4 ميكن أدوات امجموعة من تخليل السانات واستكتهاقيها يبشكل 
تعاونيء وبناء التطبيقات» والتداخل مع تطبيقات الخرائط كخرائط جوجلء وبناء وتبادل 
القضص السردية: ونش الأخير يعدا اجتماعيا للأذوات: مما 5S‏ الزملاء وغيرهم من 
تاذل تفسيرات حسية متعلقة بالتمثيل الصوري (انظر الشكل © - 5). 


التحليل (Statistical analysis) Lazy]‏ : 
هناك تاريخ طويل من الأساليب الإحصائية التي يجري تطبيقها على البيانات الكمية في 
محاولة لفهمها. فالإحصاء الوصفي يفصل خصائص وتوزيع نقاط البيانات ومستوياتها من 
الخطأ وعدم اليقين. ويشتمل الإحصاء الوصفي على تحليل السلاسل الزمنية التي تنص على 
كيفية تغيّر البيانات بمرور الزمن» ونظرية الرسم البياني التي تدرس بشكل رياضي تنظيم 
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هياكل الشبكة» والإحصاء المكاني الذي يصف هندسة وأنماط التجميع: والتشتتء والانتشار 
ي حين يسعى الإحصاء الاستدلال إلى شرح وليس مجرد وصفء الأنماط والعلاقات التى 
قد توجد داخل مجموعة البيانات» واختبار قوة وآهمية الارتباطات بين المتغيرات. كما 
يشمل الإحصاء البارامتري (المعلمي) الذي يجري استخدامه لتقييم الفرضيات باستخدام 
بيانات الفاصل الزمني وبيانات مستوى النسبةء مثل الارتباط والانحدار؛ والإحصاءات غير 
المعلمية المستخدمة لاختبار الفرضيات باستخدام بيانات المستوى الاسمية أو الترتيبية؛ 
والإحصاءات الاحتمالية التي تحدّد احتمال حدوث حالة ماء مثل تحليل النظرية الافتراضية 
(82(65131). ويجري تطبيق تقنيات الإحصاء الوصفي والاستدلالي التى تستخدم تقليددا 
فى تحليل البيانات الصغيرة في البيانات الكبيرة أيضاء وكما جرى نقاشها في الفصل التاسع 
فإن هذا ليس سهلا على الدوام لأن الكثير من هذه التقنيات جرى وضعها لرسم رؤى من 
البيانات الشحيحة وليست التوافرة بشكل فائض. ومع ذلكء توفر هذه التقنيات وسائل 
للاستفادة من كميات البيانات الهائلة» كما يضمن حجم البيانات الهائل إمكانية تجزتتها إلى 
مجموعات بطرق عديدة دون أن تصبح صغيرة li>‏ مما لا مكن معه حساب الاختلافات 
بين مجموعتي الضبط وامعالجة بصورة ذات معنى. وتستخدم الإحصاءات بشكل روتيني 
في المساعدة على التنقيب عن البيانات والتنبؤ بها وتحسينها (انظر الجدول .)١ - ١‏ 


:(Prediction, SimulationandOptimisation) 5.27713 85 l:5Jl5 23 9I 
هناك طريقة أساسية في الحصول على القيمة من البيانات وهي استخدامها لمحاولة‎ 

معرفة أو توقع ما سيحدث في ظل ظروف مختلفة. على سبيل ا مثال» قد ترغب شركة ما في 
توقع ردود أفعال العملاء تجاه منتج معين أو حملة ماء أو قد تحتاج الحكومة المحلية إلى 
محاولة التنبؤ بكيفية عمل البنى التحتية للنقل إذا جرى إغلاق عنصر مهم ذو حساسية:. أو 
قد يسعى العلماء إلى التنبؤ موعد احتمال حدوث انهيار أرضي وتحت أية ظروف. إن مثل 
هفذة القلوفاتةهفيدة عذا للمنظمانة هن ححث مكتها من القفظ كل AEA E E‏ 
المختلفة. وللشركات من حيث إنتاج أثر لزيادة نمو الأرباح (انظر الفصل السابع). وفي 
جميع الحالات» تُبنى النماذج باستخدام المعرفة القائمة سلفا عن كيفية عمل النظام: والتى 
تعالج البيانات لتقدير النتائج المحتملة في ظل سيناريوهات مختلفة. وكما في التنقيب عن 
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البيانات» هناك العديد من الطرق ال مختلفة التى مكن استخدامها لإنتاج النماذج التنبئية. 
ولكل منها نقاط قوتها وضعفهاء وهي تنتج تنبؤات أقل خطأً أو أكثر دقة بالاعتماد على 
نوع المشكلة والبيانات (2010 151461 00 ذم»5). ومع ذلك: من الصعب الحكم مسبقا 
على أن أي نوع من النماذج» وإصداراته ال مختلفة. سيعمل بشكل أفضل على 8 ÅS gano‏ 
بيانات معطاة. وقد تمثل الحل لهذه ال مسألة في استخدام نهج مركب يستفيد من الكمية 
الهائلة من الطاقة الحاسويية المتاحة للمحللنن الآن (2013 أمع516). فعوضًا عن اختيار 
نهج واحد وبناء عدد قليل من النماذج:ء فالنهج المركب يبني نماذج متعددة باستخدام 
مجموعة متنوعة من التقنيات للتنبؤ بالظاهرة نفسها. وبعد ذلك» بدلا من تحديد النتائج 
(التقديرات) من النموذج الأفضل أداء. يجري العمل على الجمع بين التقديرات من جميع 
النماذج لإنتاج إجابة واحدة شاملة. ويؤدي تجميع النتائج إلى نتائج أكثر قوة كما تعوّض 
العملية نقاظ الضعف في كل نموذج. على سبيل المثالء قد يبني نهجا مركبا لتوقع سلوك 
العملاء سلسلة من نماذج الانحدارء والشبكات العصبية» والجار الأقرب: وشجرة القرارات. 
فكل نموذج قد يكون أفضل من غيره في التنبؤ بأنواع معينة من المستهلكينء ولكن يمكن 
تقليل الفروقات من خلال الجمع بين مخرجات النموذج» مما يزيد التنبؤ 858 Franks)‏ 
Siegel 2013‏ ;2012(. فباستخدام طريقة تضم العديد من النماذج ال منسجمة ممكن تطبيق 
المئنات من الخوارزميات المختلفة على مجموعة بيانات. ومن ثم ضمان إنتاج أفضل نموذج 
تنبؤي ممكن. 

فالمحاكاة هي عبارة عن نماذج تسعى إلى نمذجة العمليات والأنظمة في العالم الحقيقي. 
والهدف من ذلك هو تحديد كيفية عمل نظام ما وكيفية سلوكه وفقا لسيناريوهات مختلفة, 
وتقييم agp Gla lol‏ تحسنن كفاءتها وفعاليتها (2003 112507ط120). ومن الأمثلة 
الشعبية لعبة الحاسب الالي سيم سيتي Sl gäl (SimCity)‏ كيف ممكن طدينة أن تنمو 
وتتطور في ظل ظروف يختارها اللاعبون» قائمة على أساس النموذج الكامن وراء العمليات 
اطدنية المعروفة. وبامثلء تستند توقعات الطقس على محاكاة لكيفيه تطور الطقس بالنظر 
إلى الظروف السائدة والمعرفة العلمية. وهناك العديد من الأنواع ا مختلفة لنماذج المحاكاة. 
والتى استفاد كثير منها من التعلم الآلي من أجل تحسين عمل النموذج بشكل تلقاني 
والتعامل مع الخصائص الناشتة مثل الأحداث غير المتوقعة. إن نموذج سيم سيتي هو 
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نموذج قائم على التوكيل (2007 (Agent-based) (Batty‏ ويتكون هذا النموذج من بيئة 
تمكن من تعيين خصائص معينة للميزات الفردية فيها مثل المباني والطرق. ويتم تعيين 
خصائص هذه البيئة بواسطة وكلاء» وعند تشغيل النموذج» يسعى الوكلاء إلى حل مهمة ما 
والتفاعل مع البيئة وغيرهم من الوكلاء الاخرين بالاعتماد على خصائصهم المسندة إليهم. 
وبا طمحصلة» عند قيام الوكلاء مهامهم» يقومون بتغيير البيئة» وهي في هذه الحالة المدينة 
التي يسكنونهاء وإنتاج نظام معقد ومتغير. ومن ثم فإن النظام يعمل من أسفل إلى أعلىء 
مع أنماط مكانية وزمانية تتغيّر من تفاعلات الوكلاء الفردية مع البيئة. وتستخدم مثل هذه 
النماذج لمحاكاة القضايا ا ممدنية خارج الألعاب لنمذجة استخدام الأراضي وتخطيط النقل 
ووضع خطط الطوارئ للكوارث (2007 (Batty‏ 


ويهتم التحسين بتحخديد الإجراء الأمثل لتحسين الأداء (عادة من خلال خفض التكلفة 
أو زيادة العائد أو المخرجات). ويمكن حساب التحسين باستخدام وتقييم نماذج التنبؤ 
والمحاكاة. أو تطويرها من خلال أنواع أخرى من الخوارزميات أو الاختبار الإحصائي. فعلى 
سبيل المثال. تستخدم الخواززميات الجينية. وهو نوع معيّن من التعلم الآلي: الأفكار 
امنتقاة من الطبيعة. مثل الوراثة. والطفرات. والاختيار والتهجينء لوضع وتطوير حلول 
ممكنة لمشكلة ما (1996 611<ء]811). كما يسعى علم الشبكات العصبية: وهو نهج آخر 
مستوحى بيولوجياء المحاكاة كيفية عمل الدماغ البشري. باستخدام عناصر اممعالجة العالية 
الترابط لحساب وتقييم وحل مشكلة ما )2000 GS. .(Picton‏ يمكن استخدام اختبار أ/ب 
(A/B Testing)‏ بشكل دوري لتقييم وتطويع نظام ماء من خلال مقارنة مجموعة ضوابط 
مع مجموعات اختبار مختلفة من أجل تحديد العلاجات (على سبيل المثال: النصوصء. 
والتصاميم: والصورء والألوان المستخدمة على موقع إلكتروني على الإنترنت) لتحسين هدف 
معين (على سبيل المثال» معدلات التبرع). 


الخلاصة: 
كان الهدف من هذا الفصل تقديم لمحة عامة عن مجموعة من الاليات الناشئة وتحليلات 


البيانات التي يتم استخدامها ممعالجة وتحليل وتطبيق البيانات الصغيرة ال موسعة والبيانات 
الكبيرة. لقد تم نبذ مثل هذه الأساليب لعدد من السنوات» ولكنها أصبحت أكثر انتشارا 
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ويمكن الوصول إليها مع تطورها ونضجهاء وتوفر المعالجة الحاسوبية المطلوبة لتصبح متاحة 
على نطاق أوسع. ومع ذلك. يطرح حجم وسرعة البيانات الكبيرة تحديات جدية لآليات 
التحليل وما قبلها بسبب عدم تصميم العديد من هذه الاليات التقليدية والخوارزميات 
لتتناسب مع المليارات من ال ملاحظات: أو لتتعامل مع مجموعات بيانات سريعة التغير 
.)Batty et a. 2012)‏ ومن تم فمن الواضح أن هناك حاجة إلى مزيد من البحوث 
لتكييف. وصقل وتوسيع الآليات الحالية وابتكار أساليب جديدة يمكن لها إضفاء معنى من 
البيانات الكبيرة والبنى التحتية للبيانات واستخلاص القيمة منها. وعلاوة على ذلك؛: أضحت 
الأجيال الجديدة والقديمة من العلماء ومحللي الأعمال. على حد سواءء بحاجة إلى التعرف 
على مصادر البيانات الجديدة وخصائصهاء وأن تتعلم مجموعة جديدة من المهارات إذا 
كانت تريد أن تكون قادرة على الدراسة والاستفادة من رؤى وأفكار طوفان البيانات القائم؛ 
متضمنا ذلك معالجة البيانات المنظمة والبينات غير المنظمة» والترميز الأساسيء والتنقيب في 
البيانات» والتمثيل الصوريء والنمذجة. والمحاكاة (انظر الفصل التاسع). 

إن'هذه التحديات لآ تقوم على مجرد أسّس تقنية أو Sl ids pio alga‏ آليات'التحليل 
as‏ انعكاسًا لطريقة معينة في الرؤية والاستشعار للعام المحيط؛ فهي مظهر من مظاهر 
المعرفة الخاصة. وكما نوقش في الفصل الثامنء تثير البيانات الصغيرة الموسعة والبيانات 
الكبيرة وآليات التحليل ال مرتبطة بها تساؤلات جوهرية بشأن تنظيم وممارسات العلوم 
(Floridi 2012)‏ مع العدید من اممقترحات التي توحی بالدخول في نموذج علمى جديد. 
ونتيجة لذلكء لا يتطلب التصدى لطوفان البيانات مجرد فكر جديد حول طرق التحليلء 
ولكن تفكيراً Dla‏ فيما يتعلق .42 .(Leonelli 2012) eslsJl‏ ويستدعي جزء کبير من 
هذه المهمة التفكير النقدي في التأطير الواسع للتحليلات وآليات الطرق واطناهج المحددة. 
والتفكير في كيفية إنتاج آليات التحليل الجديدة أنواعا معينة من المعارف والرؤى للعام 
المحيط بناء ومن ثم العمل على معرفة عمل هذه المعارف الجديدة فى العام متضمنا 
ذلك نمذجة كل الأشياء ‘Beer and Burrows 2013; Ruppert 2013) UJ! ;L—25 | ZJI‏ 
انظر الفصل الحادي عشر). وبعبارة أخرى. هنالك حاجة ملحة وبصورة عاجلة للبحوث 
الفنية والفلسفية فيما يتعلق بآليات التحليل الناشئة من أجل استشعار البيانات ال موسّعة 
والبيانات الكبيرة. 
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المبررات الحكومية والتجارية للبيانات الكبيرة 


(The Governmental and Business Rationale for Big Data) 


لم تتكشف ثورة البيانات دون فكر وبطريقة مجهولة: فكما هو حال الثورات الأخرى: 
جرى الدفع بها بسبب مجموعة قوية من الحجج. والتمهيد لها من قبل مجموعة من 
ا متحمسين ال مؤمنين بفوائد الطرق الجديدة للمعرفة والتعامل في هذا العالم وتحالف 
أصحاب المصالح الخاصة الذين يجنون الأرباح من ظهورها. وف حين أن الحجج التي 
اشتخد ت ان 055 وة جدا وغالبا ما تدعا sl I alea E‏ 
تشكل فى مجموغها ما أطلق عليه (1977) اه۴ مصطلح نظام الخطابة وا مجادلة. 
أي مجموعة من النقاشات المتداخلة التي تبرّر وتغذي التطورات الجديدة وتعمل على 
تطبيعها واستنساخها وإعادة استخدامها. فهذا النظام الخطابي يقدم الأساس المنطقي 
لتبني الأفكار والتقنيات الجديدة: وإضفاء الشرعية على مساعي تطويرها وسبل تنفيذها. 
وتدعو النقاشات المستخدمة في النظام إلى الترويج لرسالتهم وجعلها قناعة عامةء لترغيب 
الناس والمؤسسات باعتناق منطقهم. وإلى الاعتقاد والعمل فيما يتعلق بهذا المنطق 
.)(0dge and Kitchin 2005)‏ كما عملت على إنتاج أجواء معيّنة يتم من خلالها 
am dosi‏ خاصة من الفكر وا ممارسة بحيث تبدو طبيعية ومرغويا Amin and) "l3‏ 
(Thrift 2013: 5‏ 125( 535 نوعًا خاصًا من الاستجابة العاطفية )2009 (Anderson‏ 
فمثل هذه الخطابات والأجواء سعت إلى إعادة صياغة العالم وفق رؤية خاصة؛ وإعادة 
تشكيل "القضاياء الفاعلينء المخاطرء المصالح» والرغبات التي تنتشر في الحقل السياسي 
وا مشهد الاقتصادى )4 :2013 (Barnett‏ 

وكما تم النقاش في الفصلين الثاني والثالثء فقد سعت نظم الجدال وامحاورة المتداخلة 
إلى الدفع بعمليات تطوير البنى التحتية للبيانات والبيانات المفتوحة مستخدمة النقاشات 
واطمداولات حول تبادل ومشاركة السانات. واستنساخها وإعادة استخدامهاء وحرية النفاذ 
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والوصول إليهاء والحكومة المفتوحة. والشفافية. وا مساءلة. وتنظيم المشاريع الاجتماعية؛ 
واقتصاديات السعة ووفورات حجم الإنتاج. وكما تم بيانه في هذه الحالات» فإن منحى 
النقاش وطريقة التداول قد تكون مدفوعة من قبل مجموعة من الأطراف المعنية التي قد 
تستخدم الحجج نفسها ولكن لتحقيق مرام مختلفة (على سبيل المثال» تستخدم منظمات 
ا مجتمع المدني وقطاعات الأعمال الكبيرة خطابات الشفافية والمساءلة لإتاحة بيانات الحكومة 
وفتحهاء ولكن أحدهما لأسباب مدنية والأخرى AUS guy)‏ من السانات). فالأنظمة 
الخطابية إذا لم تكن حَضرًا نتاجًا فوقيًا من الدول أو الأعمالء ولكنها انتشرت وسنت من 
خلال العديد من القنوات الأصغر kas‏ (1978 ,1977 غ11اوهء1011). وقد جرى قبولها دون 
إشكالية من قبل الجماهير» من المواطنين والمؤسسات الذين كان من السهل استمالتهم 
من خلال منطقهم. وبالآأحرىء فإن الخطابات مفتوحة للتحديء والرد عليها. ومقاومتها. 
وتفنيدهاء ومخالفتهاء والتصدى لهاء وإظهار عوارهاء وتقديم رؤى بديلة جديدة: وفي كلتا 
الحالتين» يستند ال مرؤجون أو المعارضون لرؤى جديدة على السجل الزمني اللممتد من الماضيء 
إلى الحاضرء وحتى ا مستقبل لدعم حججهم» وذلك باستخدام الأدلة والشواهد من جولات 
سابقة من التغير الاجتماعي والاقتصادي» إلى جانب التحديات الحاضرة: والتكهنات حول 
الكيفية التي يمكن أن تش كل الكيفية التى ستكون عليها الأمور خلال سنوات قادمة: في 
ظل سيناريوهات مختلفة. (2012 ,2011 7إ163111351). ومن ثمء جرى تداول المشهد الخطابىي 
عبر جولات من التفاوض باسم الصراع على الأفكار والسبل لهيكلة وتمثيل وعمل وتنظيم 
ا مجتمعات. في الحاضر وا لمستقبل. 

وفي هذا الفصلء. سيجري دراسة اطبررات المنطقية للبيانات الكبيرة للجهات الحكومية 
وقطاع الأعمال. وقد تم تنظيم النقاش حول أنماط خاصة من النظم والأنشطة الاجتماعية 
بدلا من تنظيم الفصل بحسب مختلف الخطابات التي يشيع توظيفها للترويج لإشاعة 
اعتماد البيانات الكبيرة على سبيل الممثال» التبضر والحكمة» الإنتاجية» القدرة التنافسية 
الكفاءةء الفعالية» الفائدةء الاستدامة»ء .(Securitization) JU Ll $5 sls‏ فالخطب 
تمتلك تأثيرها الأقوى عندما يجري تعبئتها وتوجيهها في مهام وقضايا معينةء واممثير في 
حالة البيانات الكبيرة هو ان جدالها هتد إلى جميع القطاعات والشرائح - الاجتماعية: 
والسياسية» والاقتصاديهة» والبيئية؛ فهي واعدة من خلال تقدبمها وسائل جديدة كليا في فهم 
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وإدارة جميع جوانب حياة الإنسان. وهناء سيتم مناقشة هذا الوعد فيما يتعلق بأربع 
مهام رئيسية هي: حكم الناس وتنظيمهم» وإدارة المنظمات» وتعزيز القيمة وإنتاج رأس 
الماله وأخيرا إنشاء أماكن أفضل. وهذه مهام توضيحية فقطء على سبيل الحصر وليست 
la‏ حيث إن هناك العديد من التطبيقات الأخرى الممكنة: بما في ذلك القضايا البيئية 
Mayer-Schonberger and Cukier 2013; Siegel 2013; Smolan and Erwitt hl)‏ 
72 وستتم مناقشة كيفية إعادة تشكيل البيانات الكبيرة للبحوث في الفصل التاليء كما 
سيجري مناقشة الدعوات ال مضادة لتطبيق البيانات الكبيرة في الفصل العاشر. 


حكم الشعب وتنظيمه :(Governing People)‏ 

الدولة هي مولدٌ ومستخدم رئيس للبيانات» فمنذ عصر التنوير سعت-الدولة لإنشاء 
طرق أكثر منهجية. من جهة: لإدارة وحكم المجاميع السكانية: ومن ناحية أخرىء لتقديم 
الخدمات للمواطنين. فإحدى هذه الطرق الرئيسية التى هدفت من خلالها إلى أداء هذه 
الأدوار بكفاءة وفعالية كانت من خلال التدقيق والتقدير الكمي والنوعي للمجتمع - أي 
بناء معرفة مفصّلة لإنفاذ ولايتها القضائية والاختصاصية من خلال تطوير النظم الإدارية 
على نطاق واسع.: بدعم من أجهزة فنية وتقنية dde gta‏ تعمل على قياس وتتبّع فهرسة 
وتمسز السانات عن الأفراد. والشركاتء والمؤسسات: وال مكونات الأخرى (انظر 2120 8101150 
Starr 1987; Barnes and Hannah 2001; Desrosieéres 1998; Kitchin and Dodge‏ 
Porter 1995‏ ;2011( إن إنتاج» وإدارةء وتخزين» وتحليل البيانات من اطهام الرئيسية 
في جميع مؤسسات الدولة. فهي تستخده في تقييم الالتزامات والاستحقاقات للموضوعات 
السيادية وغير السيادية: والكشف وامراقبة عن الخروقات وعدم الامتثالء والتهرب» 
والغشء فيما يتعلق باطعايير والالتزامات القانونية ا ملعمول بها (1996 A3 .(Rose‏ 
سبيل اطثالء يتم في الدوائر الحكومية. وخاصة تلك المتعلقة بالتمويل والتجارة والرعاية 
dae MI‏ تحديد جميع امواطنين والكيانات وتتبعهم» ورصد القضايا والاتجاهات من 
خلال التحديثات على سجلاتهم» وتعيين ملفاتهم التعريفية وربط بياناتها بهم» وتعقب 
المدفوعات» وإدارة انضباطهم والخدمات المقدمة لهم. آما في المدارس» فيؤخذ التسجيل 
لبياناتهم» واحتساب وتقييد الدورات الدراسية وعلامات الاختبارات» ويتم مكافأة الطلاب 
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ومعاقبتهم وفقا لأدائهم وسلوكهم. وف قطاع الصحةء يتم قياس حالة المريض» وتسجيلها. 
والعمل على أساسهاء واحتساب وتقييم أداء ا مرافق الصحية. كما تعنى وكالات حكومية 
متخصصة أخرى بإنتاج وإدارة وتحليل ونشر البيانات التى لها بالغ الأثر في إفادة العمل 
الحكومي. على سبيل ال مثالء الوكالات الإحصائية. وهيئات ال مسح ورسم الخرائط الجغرافية 
وأجهزة الاستخبارات التي تتعهد ببرامج مستمرة لإنتاج البيانات من خلال أنظمة قباس 
مثل المسح وامراقبة. 


ولتعزيز ممارساتها الحسابية» سعت الدولء من جهة. لتبرير وترشيد نظمها وعملياتها 
على الموضوعاتء ومن جهة أخرىء لتطبيق وسائل إدارية أكثر تعقيدًا وتفصيلا من أي 
a zo Je us l8. .(McNay 1994; Miller 2001) (sa s c 39‏ الخطابات حول 
الحكومة الفعالة والقيمة مقابل «JU.‏ واطواطنة والتمكينء والعدالة ومكافحة الجرممة: 
والأمن والسلامة» والتي تتماثى مع فكرة تناول المشاكل والقضايا العامة من خلال المنطق 
الجماعي واطبادئ المشتركة. وتجابه هذه الخطابات من قبل أولئك الذين لديهم الرغبة في 
تقليل مستوى رقابة الدولة وسلصطتها مقابل الحريات الشخصية. والرقابة والضبط للنظم 
ا مجتمعية والاقتصادية: أو أن تكون أكثر انفتاحا واستجابة وإنتاجية في ا ممارسات الحكومية. 
متضمناً ذلك إتاحة البيانات التى يحملونها بشكل أكبر وأكثر حرية (انظر الفصل الثالث). 

أما المسعى الثاني فيتضمن تنفيذ أنظمة وتقنيات وبنى تحتية مصممة لجمع ومعالجة 
البيانات على نحو فعال وأكثر تطورًا من أي وقت مضىء متضمنا ذلك الأنظمة الأكثر ثبانًا وقدرة 
في التعريف والتحديد (التواقيع والصور وبصمات الأصابع:؛ وأرقام الضمان الاجتماعي وجواز 
السفرء وقوانين الضرائبء وأرقام الترخيص والحساباتء وال معلومات البيومترية» والمستخدمين 
وكلمات السر والرموز البريدية... إلخ)» والتي يمكن تشغيلها على نحو متزامن بشكل متزايد 
وعن بعد (2005 7نداء1؟1 20د 1200486). وعليه: يؤكد (178 :1997) 113121121 على أن أحد 
أشكال الحاكمية الأكثر فعالية يكون في الغالب من خلال تكوين "لفيف معقد من مجموعة 
بسط النفوذ والهيمنة...من خلال التعدادات والبيروقراطية والسياسات. وما إلى ذلك» وكم 
هائل من المؤسسات التخصصية مثل المدارس وأماكن العملء والأراضي ال ممتدة المجهولة المثبتة 
ملايين من نقاط الانطلاق كأجهزة الصراف الآلي: وكاميرات المراقبة» ونماذج تعبئة الطلب". 
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ولذاء فإن البيانات الكبيرة بأحد معانيها ليست شيئًا جديدًا على الدول - وهي التي 
تعاملت طويلا مع كميات هائلة من البيانات ف إدارة الاختصاصات القضائية والقانونية؛ 
كجزء جرى معالجته واتخاذ الإجراءات المتعلقة به في الوقت ال مناسب في sl au‏ قريبًا منه 
كلما تفاعلت الوكالات مع الموضوعات. ومع ذلكء ينظر إلى البيانات الكبيرة باعتبارها eas‏ 
مجموعة من التقنيات التي يمكنها توسيع وتحسين عمل الدول من خلال زيادة الانضباطية 
والشمولية للممارسات الحسابية لأعمالها. كما يتبنى البائعونء في بعض الحالات. خطاب 
الدفع بحلول البيانات الكبيرة بهدف بيع خدمات الدولة: وفي حالات أخرىء تأخذ الدولة 
بزمام المبادرة بشكل نشط. وفى الوقت الحاضرء هناك نوعان من الإستراتيجيات الخطابية 
الرئيسية ال مستخدمة لتشجيع استخداه البيانات الكبيرة في السلطات الاختصاصية. يتعلق 
النوع الأول بالتحسينات على الإدارة العامة وتقليل التكاليف من خلال تعزيز الكفاءة 
التشغيلية» وتقليل تكلفة الأخطاء والاحتيال في إدارة المنافع: وزيادة في الإيرادات الضريبية 
عن طريق تضييق الفجوة الضريبية... وتحسين تخصيص التمويل ف البرامج والخدمات ذات 
الجودة الأعلى» وزيادة ا لمساءلة في القطاع العام: وإطلاع أفضل للمواطنين", مع تقديرات 
مقترحة بعائدات لحلول البيانات الكبيرة من الكفاءة التشغيلية المتعلقة بإدارة القطاع العام 
à‏ القارة الأوروبية تعادل مئة وخمسين مليار دولار Manyika et al. 2011: 61,) Kyl‏ 
2. وسيجزي لاحقًا مناقشة هذه الحجج بشكل أكبر فيما يتعلق بإدارة المنظمات وصنع 
أماكن أفضل. 

ويهتم النوع الثاني بأمن الدولة ومكافحة الجرهة» إذ تقوم جميع الدول باطمراقبة 
والرصد لأغراض الأمن والسلامة ومنع الجرهة والاعتقال من خلال أجهزة الشرطة وجمع 
المعلومات الاستخباراتية على نطاق أوسع. وقد تمّ تطوير الكيفية التي تنفذ بها هذه 
الأنشطة ما يتماثى مع التقنيات الجديدة - كالتنصت على ال مكال مات الهاتفية واعتراض 
الموجات الراديوية» والدوائر التلفزيونية المغلقة. والتصوير الجويء. وصور الأقمار الصناعية, 
ومراقبه الإنترنت - والتي كثيراً ما جرى التبرير لها عند وقوع أحداث رئيسية مثل الحرب 
الباردةء والحوادث الإرهابية )2001 gbl Slas C33 (652 VI à 3sI (s. .(Innes‏ 
عشر من سبتمبر وما تبعها من الحرب على الإرهاب امبرر المنطقي لتغيير جذري في Olhe‏ 
المراقبة والتأمين التي تقودها الدولة على نطاق واسع )2006 .(Amoore‏ وكان جليًا لبعض 
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الوقت أن تحليلات البيانات الكبيرة كانت عنصرًا أساسسَيا في تحسين هذه الأنشطة. وخاصة 
فما بتعلق مراقبه الحدود وفحص الqجرة Kitchin and Dodge 2006; Clements)‏ 
3).. وقد كشفت تسريبات يونيو 2013 بشأن برنامج وكالة الأمن القومي الأمريكي 
بريزم (218150/1) المدى الذي وصلت إليه ممارسات مراقبة البيانات» وممارسات البيانات 
الكبيرة: والاليات التحليلية المستخدمة لجمع ومعالجة البيانات المتعلقة بالاتصالات اليومية 
لجميع المواطنين مثل OUBLI‏ اليومية: الرسائل النصيةء رسائل البريد الإلكتروني» واستخدام 
الانترنتء بدلا من اقتصارها على المواطنين الأجانب والقوى الخارجية أو لأهداف محددة 
ol sul e3a$ .(Greenwald and MacAskill 2013; Risen and Lichtblau 2013)‏ 
كانت هي الأحدث في سلسلة الكشف عن تجسس الولايات المتحدة على مواطنيها بشكل 
«alls .(Solove 2007 ; Bamford 2009) „à>‏ أن من الواضح أن الوكالات الاستخبارتية, 
والمتعاقدين العسكريين-الصناعيين. هم في طليعة مطوري الجيل القادم من أدوات البيانات 
الكبيرة لإدراك الكميات الهائلة من البيانات عالية السرعة. وقد استثمرت بكثافة في بناء 
الكفاءات والتقنيات واطرافق على سبيل المثال. جرى استثمار 1.7 ملیار دولار آمریک ف 
مركز البيانات القائم في يوتا لمعالجة وتخزين البيانات الكبيرة التي تم جمعها من الولايات 
.(Carroll 2013)‏ وبينما تسعى الدول إلى ترشيد تلك امراقبة ذات النطاق الواسع على 
مواطنيها من خلال الخطابات العامة الموجهة للأآمن والسلامة. فإن الحقيقة المائلة هي 
أنها قد طوعت الكثير من أجهزتها سرا لتنفيذها ودون اتباع للإجراءات القانونية الواجب 
العمل بها مما يقوض اطثل العليا للدمقراطية القانئمة على الشفافية والثقة Clements)‏ 
US gag (2013‏ فمن غير المرجح على المدى القصير أن يقوم الغضب الشعبي العارم على 
هذه الممارسات والتجاهل الصارخ للحقوق الأساسية مثل الخصوصية: على إبطاء أو إعادة 
تشكيل طريقة التعامل مع البيانات الكبيرة في هذا الجانب من الحكم. ولا لثني الخطابات 
التى استخدمت لتبريرها. 
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:(Managing Organisations) ادارة المنظمات‎ 

ماما كما تغيرت الدول وتفرعاتها الكثيرة في الحكم كالإدارات. السلطات امحلية. 
الوكالات» الجيش» مقدمي الرعاية الصحية... إلخ مع مرور الوقت» واعتمادها ممارسات 
وتقنيات إداريه جديدة لإعادة تشكيل الكيفية التي يجري بها تنظيمها وتشغيلهاء باممثلء 
قامت شركات الأعمال والكيانات المؤسسية الأخرىء مثل ال منظمات غير الحكومية والهيئات 
التطوعية وال مجتمعية: والجمعيات الخيرية: والأحزاب السياسية... إلخ. فالبيانات المتعلقة 
بمهامها الأساسية تشكل أحد الجوانب الأساسية لكيفية فهم هذه المنظمات لنفسها ودوائرها 
الانتخابية: وكيفية اتخاذ القرارات بشأن عملءاتها الحالية والمستقبلية. كما أن السانات 
تقذم الإثبات والدليل للإنتاج ا معرفي الذي يستخدم لإدارة المنظمة بشكل أكثر كفاءة. 
وفعالية» وتنافسية» وإنتاجية» وتحديد المنتجات والأسواق الجديدة (انظر القسم التالي). 


وهكذاء أصبحت نظم المعلومات على مدى السنوات الستين الماضية من البنى التحتية 
الأساسية لجميع المنظمات على اختلاف أحجامهاء مما يمكنها من تتبّع وإدارة المجاميع البشرية 
المعقدة كالموظفينء الداعمينء المانحين» والعملاء» والمكونات» والسلع الأساسيةء والبنى التحية 
عبر الزمان والمكان» وتمكينها من توسيع نطاق عملياتها من المستوى المحلى إلى ال مستوى العالمي 
.(Castells 1996; Dicken 2003)‏ فنظم المعلومات تتيح تشغيل ال منظمات بشكل اكثر «SS‏ 
وإنتاج وفورات كبيرة من تكاليف قاعدتها التشغيلية. وهناك ثلاثة من هذه النظم المعلوماتية 
ا مبنية على البيانات والتى تمّ اعتمادها على نطاق واسع: نظم تخطيط موارد ا منظمات (ERP)‏ 
ونظم إدارة سلسلة التوريد (5021). ونظم إدارة علاقات Jý—u5g (CRM) Sal‏ هذه 
الأنظمة قدرًا أكبر من التنسيق والضبط داخل المؤسسة:؛ ومع ا منظمات الأخرىء والعملاء. على 
سل «JUL‏ ينظم ويجمع نظام تخطبط موارد المنظمات العديد من قواعد السانات والأنظمة 
امتعلقة بالشراءء. التخزينء الجرد. النقل. التسويقء المحاسبة. إدارة شؤون الموظفين وإعداد 
قوائم المرشحينء إدارة المشاريع: والعلاقات مع العملاء في نظام واحد شامل يضمن بصورة 
سهلة وتلقاشة توافر السانات والعمليات من حزء واحد من الأعمال لجزء آخر (.21 Dery et‏ 
Ga ©] 21. 6‏ ;2006). كما تستخدم نظم إدارة سلسلة التوريد J Sb (SCM)‏ 
من الكفاءة لتنظيم اطمشتريات» والحركة» وإدارة وتخزين امواد من الموردين من الشركة وحتى 
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الزبائن )2012 and Meindl‏ 12م10)). في حين تسعى نظم إدارة علاقات العملاء (CRM)‏ 
إلى بناء علاقات شخصية مع العملاء من خلال جمعها أنماط الحجوزات والمشتريات السابقة 
لهم» وعرض التفضيلات والخدمات ال ممكن الاستفادة منها خلال 5 (eal)‏ والاستفادة منها في 
تقديم مكافآت الولاء» والعروض الخاصة:؛ والترقياتء وتقديم التوجيهات للموظفين والأنظمة 
لبظهروا مظهر العارف بالعميل )2005 o» Brynjolfsson et al. (2011) asi J89 .(Sigala‏ 
خلال دراسة شملت 179 شركة من شركات التداول العام الكبيرة على اعتماد هذه الشركات فى 
اتخاذ القرارات اطبينة على البيانات (101010 -10615102 (Data Driven‏ حیٹ یکون الناتج 
والإنتاجية أعلى بما يراوح بين 7-0 “ loe‏ هو متوقع عند الاعتماد على استثماراتهم الأخرى 
وطرق استخدام تقنية المعلومات. 

ويُنظر إلى البيانات الكبيرة من قبل العديد على أنها المرحلة التالية في العملية الجارية 
التي تسعى إلى الكفاءة التنظيمية والبنى التي تعزز الميزة التنافسية» مع الحد من المخاطرء 
والتكاليف» والخسائر التشغيلية» وتحسين تجربة العملاء. فالذي توفره البيانات الكبيرة هو 
الإمكانية الشاملة وامفصّلة لغاية إدراك جميع جوانب عمل المؤسسة بشكل أني ولحظي. 
وكما افترضت جماعة الضغطء. مؤسسة تك TechAmerica Foundation 2012:) IS 5 ,al‏ 
12(« فإن البيانات الكبيرة ستضع الأساس: لاستبدال أو دعم عمليات اتخاذ القرار البشرية 
بخوارزميات آلية. مما يعمل على الحد من أوجه القصور داخل المنظمات؛ ويوجد الشفافية؛ 
ويحسن الأداء من خلال تمكين التجريب لاكتشاف الحاجات وإظهار التباينات؛ وتحسين العائد 
عن الاستثمار (1201) لاستثمارات تقنية ا معلومات. وتحسين عملية اتخاذ القرار والتشغيل 
الذي؛ وتوفير قدرات تنبؤية لتحسين مخرجات adl tela]‏ من التهديدات الأمنية والجريمة؛ 
والقضاء على الهدرء والاحتيال. وإساءة الاستخدام والمعاملة؛ وابتكار نماذج أعمال وخدمات 
مستفيدين جديدة. 

وبعبارة أخرى. ستوفر البيانات الكبيرة معرفة لحظية غاية في الدقة المفصّلة لكبار 
المديرين في جميع مناحي منظماتهم والتي يمكنهم من خلالها صياغة دورات عمل محكمة. 
وستمكق الائات الكدرة ابلتظمات هخ أأن تكون أكثر فظنة: وملاة: ومونة: ومفكرة: 
وذكيه في كيفية تنظيمها وتشغيلها (2011 (Manyika et al.‏ 
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ومثال على كيفية التوظيف الناجح للبيانات الكبيرة من قبل منظمة غير تجارية 
لإعادة هيكلة وإدارة عملياتها الحملة الانتخابية لباراك أوباما عن الحزب الدهقراطي. 
فكما أشرنا فق الفصل الرابع» فقد تبنت الحملة الانتخابية لأوباما البيانات الكبيرة» من 
خلال جمع مجموعة هائلة من البيانات من مصادر متعددة وإنتاج بيانات اقتراع معتبرة 
لحظيا في الوقت المناسبء من أجل إدارة $y‏ الفعل: وتشكيل الإستراتيجية: والإجراءات: 
ومهام العاملين والمتطوعين. واستنادًا إلى تحليل الأداء عام .٠٠١8‏ فقد نمت مجموعة 
تحليلات البيانات للحملة الانتخابية لأوباما للعام ۲١٠۲‏ في الحجم خمسة أضعاف عنها في 
حملة ۲٠١۸‏ متضمنة روادا تقنيين جرى التعاقد معهم من 35.5( (Scherer 2012) 4£L.aJI‏ 
وقد حسّنت هذه المجموعة العلائقية بين البيانات التي تمّ جمعها من مصادر مختلفة 
بحيث أمكن ربظها معا بشكل أكثر فعالية. كما طوّروا تطبيقات للحملة الانتخابية. وجرى 
استخدام شبكات التواصل الاجتماعي مثل فيسبوك للدفع باتجاه التسجيل للانتخاب 
والحصول على التضويت لصالحهاء وتشيت ملفات تعريف الاراط (60014165©) الخاصة 
بهم وتلك المتعلقة بأطراف تم التعاقد معها على أجهزة الزائرين لموقعهم الإلكتروني 
لجمع البيانات عنهم وتتبع عاداتهم على الشبكة )2012 .(Crovitz 2012; Kaye‏ 
كما قاموا بتحسين تصنيفاتهم التعريفية وتوقعات النماذج التنبئية وكيفية استخدام 
ا معلومات الناتجة عن تحليلاتهم لتوجيه الحملةء بالإضافة إلى اختبار وصقل طرق زيادة 
التمويل لدعم الحملة مالمًا (2012 :زء:عداء5). كما أضافوا وعالجوا السانات الجديدة 
بشكل مستمر مع تشغيل لأنظمة ال محاكاة للتنبؤ بالنتائج وأفضل الردود. وكما صرّح 
أحد مسؤولى الحملة: "لقد شغلنا نموذج المحاكاة 77,0٠٠‏ ألف مرة في كل ليلة" لتحديد 
احتمالات الفوز في كل ولاية متأرجحة". وفي كل صباح يصل إلينا الناتج» هذه هي فرص 
نجاحكم في الفوز في هذه الولايات» وبهذه الطريقة تم تخصيص اموارد (مقتبس عن 
nm = ð Jav sä .(Scherer 2012‏ على مزايا مهمة عن منافسيهم من خلال 
التشغيل المستمر مجموعات قواعد البيانات اطمتخرة من خلال خوارزميات متطورةء 
Issenberg (2012: 246) jL 3l 4e s‏ إلى أن حملات أوباما الانتخاسة كانت "ال لمجموعة 
Na OBESE‏ القافة عل áo exl d ule lg «S6Ll‏ 
الصارمة ". وهذا هو وعد الدعاة للبيانات الكبيرة بأن الفوائد العائدة عنها كالتي اكتسبها 
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الحزب الدمموقراطي من البيانات الكبيرة» لها أن تتحقق لجميع ال منظمات وغيرها من 
شركات قطاع الأعمال. 
تحصيل القيمة وإنتاج (Leveraging Value and Producing Capital) JU |l;‏ 
فضلا عن جعل الشركات أكثر كفاءة وفعالية ف إدارتهاء يتم الترويج بكثافة للبيانات 
الكبيرة لتكون وسيلة لرفع مستوى القيمة الناتجة من أنشطة الشركة وعلاقاتها مع الموردين 
وا مستهلكين. وف الواقع. وكما أشار )2011( Gantz and Reinsel‏ 518 3,24 !5« 
للبيانات الكبيرة ليس تقنيا؛ ولكنه مالي مع الوعد بالمزيد من الكفاءة والأرباح. ومن ثم 
فإن اعتماد حلول البيانات الكبيرة هو إستراتيجية لإدراك تراكم رأس المال غير المستغل 
بطريقة تقدم عائدا hus‏ من الاستثمار وتوفير ميزة تنافسية );2011 Manyika et al.‏ 
.(Zikopoulos et al. 2012‏ وهناك العديد من الطرق التي مكن من خلالها لحلول 
البيانات الكبيرة أن تضفى الذكاء للشركات وبطريقة يمكن معها أن تنمو مبيعاتها وأرباحها. 
فمع الأخذ لقطاع البيع بالتجزئة كمثال. حدد )2011( ye „às åiw Manyika etal.‏ 
مقسّمة إلى خمسة أنواع - التسؤيقء والترويجء والعمليات. وسلسة التوريدء ونماذج الأعمال 
الجديدة - مكن لكل منها تحصيل مكاسيب محتملة 3 مجال المسعات والكفاءة (انظر 
الجدول .)۷-١‏ وهي تشمل إنتاج بيانات عبر الشركة وتطبيق آليات التحليل من أجل 
تقسيم السوقء والتصدى لعزوف العملاء والموظفين: وتحسين المدخلات المختلفة (على 
سبيل ال مثالء المكوناتء والعمالة: واطرافق) وتؤدي من ثم إلى بناء مختلف التشكيلات 
والنماذج التنبئية للإجابة عن مجموعة متنوعة من الأسئلة من قبيل: 
٠‏ هل يتم الاتصال بالعميل أم لا (التسويق المستهدف)؟ 
° أي نوع من الإعلان أو اخشار الكلمات / الصور أو اطمنتح تة تقدم asis‏ للعميل (انتقاء المحتوى)؟ 
e‏ أي قناة ينبغي الاتصال من خلالها بالعميل (اختيار القناة)؟ 
٠‏ هل يتم تقديم عرض al del‏ أقل Er‏ للعميل (التسعير /الخصم امتغير)؟ 
٠‏ هل يتم شطب جزء أكير من الدين عن ال مقترض (التحصيل)؟ 
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هل يتم تقديم حد ائتماني أعلى أو أدنى أو معدل فائدة Lal‏ (مخاطر الائتمان)؟ 
(Siegel 2013)‏ 

وللتركيز على نوع واحد من أنواع الحلول الخمسه التي .Manyika et al. (2011) l4s33‏ 
وهو التسويقء يمكن استخدام عدد من آليات التحليل وأدوات إدارة البيانات الكبيرة 
الموزعة في أربعة محاور هى: التوحيد والاختزال: التقسيم والتجزئة: المطابقة» والتحسين. 
وذلك لإدارة ومعالجة وتحليل وتفسير البيانات من أجل تلبية الأهداف (انظر شكل (V - ١‏ 
إن هدف التسويق السلوى هو بيع البضائع والخدمات بصورة أكثر فعالية للأفراد والعملاء 
وبناء علاقة طويلة المدى معهم من أجل الحفاظ على عاداتهم وذلك من خلال الانسجام مع 
خصائصهم» وسلوکهم» وميولهمء ورغباتهم (2011 5010176 2110 5611:31162). فمن خلال 
بناء الملفات التعريفية الفردية للأشخاص ودمجها مع التحليلات التنبئية» تسعى الشركات 
إلى تقديم تجربة شخصية من خلال التسويق الجزيي للمنتجات والعروض الخاصة. وق 
سبيل ذلك. تسعى الشركات إلى توقع نية العميل في الشراء وتسهيل تحقيقهم لهذه النية 
بلطفء مع السعي لبناء ؤلاء العملاء في الوقت نفسه (2013 (Minelli et al.‏ وفي ذات 
ishl‏ زعم 566125010 8111 أن "الموزعين يستخدمون البيانات الكبيرة في محاولة للحصول 
على المستهلكين" ( مقتبس (Bollier 2010: 24 (à‏ 

وقد تم بالفعل تنفيذ مثل هذا النهج للبيانات الكبيرة من قبل عدد من تجار التجزئة 
مثل وول مارت وتيسكو. حيث تنتج مثل هذه السلاسل من المتاجر كميات هائلة من 
البيانات يوميًا من خلال نظم تخطيط موارد المنظمات (8182): وإدارة سلسلة التوريد 
8jlals (SCM)‏ علاقات العملاء (CRM)‏ الخاصة بهاء مما في ذلك ربط منافذ المبيعات 
بالزبائن من خلال بطاقات الولاء والائتمان ( في حالة وول مارت هناك ما يقارب FIV‏ 
مليون معاملة (Lag‏ واستخدامها لوضع إستراتيجيات أفضل للأسعار. ومخططات التخزين, 
وإعداد قوائم الموظفينء ومراقبة اممخزون» والحملات الإعلانية» وتكاليف امموردء وتحديد 
مواقع جديدة للتخزين واممنتجات....إلخ» واقتطاع حصة من سوق منافسيها عند القيام 
بذلك )2010 (Bollier‏ وعوضا عن إجراء مسوح عينية ضيقة ودراسات استقصائية باهظة 
التكلفة. لاستطلاع اراء المشاركين عن ماذا سيفعلون: وما هي القيمة امعتبرة بنظرهم» تقوم 
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البيانات الناتجة عن العمليات والتصفح على الشبكة بالكشف عن هذه المعلومات عبر 
جميع ا مستهلكين. فالفوائد المتوقعة مرتفعة. حيث يشير (2011) .21 أء هكلاترصهة]3 إلى 
أن البيانات الكبيرة يمكن أن تزيد هوامش التشغيل لتجار التجزئة بنسبة ٠0‏ في 3s «3I‏ 
حين أن هذه الحلول المتعلقة بمبيعات التجزئة والتسويق من الممكن أن تتوفر في مختلف 
القطاعات. فإن درجة بروزها يختلف من قطاع لآخر بين مختلف القطاعات الأكثر استفادة 
من حلول معينة (انظر الجدول ۷-۲). 

(V - V) الجدول رقم‎ 


أنماط ذكاء البيانات الكبيرة للشركات 


البيع العابر للحدود (باستخدام المواقع الجغرافية للزبائن» وتاريخ الشراء. 

(Marketing)‏ والتفضيلات. وال معطيات الأخرى لزيادة متوسط حجم الشراء) 
التسويق القائم على الموقع (باستخدام الموقع الحالي بشكل آني أو «uod‏ 

على سبيل المثال نظام تحديد المواقع الجغرافية في الهواتف الذكية. 
واستهداف الزبائن الموجودين في المتاجر أو بالقرب منها) 
تحليل السلوك داخل المتاجر (تتبّع الهواتف الذكية: وسلال التسوّقء والمراقبة 
امرئية للمساعدة في تحسين مخطط توزيع المتجرء وتنوع الطنتجات» ومواضع 
الآرفف لزيادة المسعات) 
التقسيم الجزن للعملاء (استخدام تاريخ الشراء والتصفح لاستهداف العملاء 
بشكل فردي بالإعلانات والعروض الخاصة) 

التحليل العاطفي (تتبّع ورصد آراء العملاء على مواقع التواصل الاجتماعي 
لتحديد ميلهم تجاه منتج ما وتعديل الحملات التسويقية بشكل مناسب) 
تعزيز تجربة العملاء مع تعدد القنوات (إنشاء تجارب وفهارس على شبكة 
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(Merchandising) 


تحسين التشكيلة (تخصيص البضائع لحفظها في 6 من اللتاجر استنادا إلى المواقع 
الجغرافية ال محليةء وانطباع المشترين وسلوكهم: والحقائق المحلية الأخرى) 


VCI‏ التسعير (باستخدام السلوكات Ll ài‏ والجغرافيه لاتخاذ قرارات 


التسعير في مختلف اللمواقع لزيادة المبيعات / الأرباح) 
تحسان التموضع والتصميم (باستخدام السلوك ذاخل المتجر والتفاعلات على 
الموقع الإلكتروني لتوجيه عملية تصميم الموقع / المتجر وأماكن وضع البضائع 
لزيادة المبيعات) 





شفافية الأداء (التحليل المفصّلء بشكل آني أو لحظي على نحو متزايدء لتحديد 
مد ی أداء c Ule «bol‏ واطوظفين) 
تحسين مدخلات الموظفين (احتساب المستويات امثلى للتوظيف وجدوله 
اطناوبات لتفادي فرط التوظيف أوشح القوى العاملة) 


العملىات 
(Operations)‏ 






سلسلة التوريد إدارة المخزون (تحسين توقع المخزون من خلال رصد تواريخ الطبيعات. 
(Supply Chain)‏ | ودورات المسيعات الفصلية: والأحداث والظروف المحلية لضمان مستويات 
مناسبة من ال مخزون ال مطلوب) 
تحسين التوزيع والدعم اللوجستي (تحديد مواقع البضائع بشكل آني أو 
لحظي» واحتساب مسارات الطرق الأكثر ملاءمة وكفاءة من حيث الوقت 
والوقود. ومراقبة سلوك السائقينء. وجدولة أعمال الصيانة) 
مفاوضات الموردين (باستخدام البيانات المتعلقة بتفضيلات ال مستهلكين 
ومشترياتهم لإبلاغ مزودي المنتجات) 





نماذج الأعمال خدمات مقارنة الأسعار (تقديم خدمات مقارنات شفافة من أطراف ثالثة 
الحديدة New)‏ للزبائن لأسعار المنتجات بشكل آني أو لحظي عبر مختلف تجار التجزئة) 


Business Models) 


الأسواق القائمة على الويب (تجار التجزئة الذين يقدمون خدمات بقيمة 
مضافة مثل الوصول إلى الاعة الآخرينء: ومعلومات ال منتجات» واطراجعات 
الناتجة عن المستهلكينء ومقارنات الأسعار) 


.Manyika et al.2011:67-71 المصدر : جمعت من‎ 
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مقتبس من "البيانات الكبيرة: افاق جديدة للابتكار والمنافسة والإنتاجية". (معهد 
ماكيaji‏ llعJhl (May 2011) Mckinsey Global Institute‏ 


.(www.mckinsey.com/mgi.Mckinsey&Company) 


وإضافة إلى الدفع بالفوائد المتوقعة» سعى دعاة البيانات الكبيرة أيضا إلى دعم اعتمادها 
من خلال تسليط الضوء على عواقب فشل الاستثمار فيها. على سبيل المثال» أشار 11327118 
Al et al. (2011: 6)‏ أنهم: "يتوقعون أن يرونء عبر القطاعات» تحقق القيمهة التي تعود 
على المستخدمين الرئيسيين للبيانات الكبيرة على حساب المتقاعسين عنها". وبعبارة أخرى» 
سوف يتخلف أولئك الذين لا يستطيعون التأقلم واعتماد حلول البيانات الكبيرة عن الركب 
ويتعرضون للتعثر والأفول؛ لأنهم سيفقدون حصتهم في السوق. وبغض النظر عما إذا كان 
استخدام الخطابات للدفع أو الجذب. فقد أضحت البيانات الكبيرة للأعمال منتشرة داخل 
التيار الرئيسي ووسائل الإعلام التجارية منذ العام 2012م,: وبالنظر لفوائدها الموصوفة: يبدو 
أن البدء في تطبيقها على نطاق واسع سيمثل المرحلة التالية للابتكار التقني وذلك بصورة 
مؤكدة. 
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(V - Y) الشكل رقم‎ 


التسويق والسانات الكبيرة 
أهداف المسوقين قدرة المنصة 


مسارات النقر 
العمليات 


الأحداث 


)5( نظرة أحادية للعميل 


التوحيد والاختزال 


إدارة علاقات العملاء 
مكالمات الدعم 





التكتل /التجميع 

حيازة البيانات 

اختيار الخصائص 
الربط 


الرسائل الشخصية 

خوارزمات المطابقة 

حسابات المصفوفة 
تجزئة القيمة الأحادية 





التنبؤ 
خوارزميات التنبؤ 


الربحية العالية للحملة p‏ شجرة القرارات 
زمه الانحدار الخطي 


.Claverie-Berge 2012 |y امصدر: مقس‎ 





تم إعادة الطباعة بإذن من المؤسسة الدولية لآلات الأعمال. © المؤسسة الدولية لآلات الأعمال 


(International Business Machines Corporation) 
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الحدول رقم (V - Y)‏ 
فوائد السيانات الكبيرة لعشر صناعات مختارة 


المراقبة المتقدمة للحالة تحديد التصرف القادم الأمثل 


تجميع وتسعير السيارات الجديدة نمذحة الكوارث 
مطالبات الضمان الغش في المطالبات 
تحديد التصرف القادم الأمثل امراقة المتقدمة للحالة 
تحليل سجل النظام مراقبه وتحسين الحفر 
إدارة مخاطر السيولة مراقبة وتحسين الإنتاج 
تحليلات العداد الذي التحسين الآلي للأسعار 
التنبؤ بتوزيع الأحمال وجدولتها التشكيل ال محلي 
الصيانة بحسب الحالة تحسين التسويق 








منع الجرائم والتهديدات والتنبؤ بها ضمان الخدمة الأفضل 
تحليلات الاحتدال والنفايات وإساءة المعاملة ذكاء الشركة 


استحدات منتجات وخدمات جدددة 


اة اقرف ا ع اة تحليلات العملاء وولائهه 


إشراك المستهلكين في رعايتهم الصحية الصبانة التنشة 





( CIBM (n.d) el المصدر: أي بي‎ 


http://www-01.ibm.com/software/data/bigdata/industry.html 


Y‏ ثورة السانات السانات الكبيرة, والبيانات ا مفتوحة:ء والبنى التحتية للبيانات»: والنتائج المترتبة عنها 


A 


المكتبة الاقتصادية 
قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 


المبررات الحكومية والتجارية للبيانات الكبيرة 


إيجاد أماكن أفضل: 

اخترع الناس واعتمدوا على مر التاريخ على تقنيات جديدة صممت لإنشاء الثروة 
وتحسين الحياة اليومية وتعزيزها. وقد أثرت العديد من هذه التقنيات بشكل كبير 
على طبيعة وهيكل وتنظيم bodl Gwg‏ المدنية والريفية؛ في الخدمات الخاصة الممقدمة 
والنقلء والاتصالات. وبناء البنية التحتية. فهذه التقنيات تحمل في كثير من الأحيان 
تأثرات متناقضة وسلبية على سبيل JUL‏ ا مصانع التي صنعت الثروات» وفي الوقت 
نفسه التلوث البيئي أيضاء أو أن تكون مبالغا فيها بحيث تتجاوز الطاقة الاستيعابية 
على سبيل JELI‏ الاكتظاظ أو الازدحاء ال مروريء أو تنتج التبعيات التي لا يمكن أن 
تطاق على سبيل المثال: المسافات الطويلة بين مواقع السكن ومواقع العمل. إن تقنيات 
امعلومات والاتصالات (تكنولوجيا المعلومات والاتصالات) هي أحدث موحة من الأجهزة 
والبنى التحتية الجديدة التي أضحت جزءًا لا يتجزأ في نسيج البيئة التي نعيش بها. 
ومعها OSS‏ مهم من مكونات منطقها الاستطرادي وهو أنها تعمل على توفير الحلول 
للمشاكل الناجمة عن الدورات السابقة من التنمية التي قادتها التقنية - بحيث تجعل 
منها أكثر كفاءة واستدامةء ونظافة وأمناء وإنتاجية... إلخ - وكذلك إنشاء طرق جديدة 
ماما للعمل ف العام المحيط. .وئتيجة لذلك: تبنت المدن تقنية المعلومات والإتضالات. 
على مدى العقوذ القليلة الماضية: باعتبارها عنصرا أساسيًا في إستراتيجياتها الإنمائية 
„(Castells 1996; Graham and Marvin 1996; Kitchin 1998)‏ 

إن مفهوم امدن الذكية هو تجسيد لهذه الرؤية التي تقودها تقنيات ال معلومات 
والاتصالات للتنمية المدنيةء والذي يصف الأماكن التي تتكون بشكل متزايد وتراقب بواسطة 
الحوسبة المنتشرة والحوسبة في كل مكان. ويقود ضبط اقتصادها وإدارتها الإبداع: والابتكار, 
وريادة الأعمال. من قبل أناس أذكباء. وهذه المدن الذكة مجهزة بشكل مكثف 3 oS‏ 
فهمها وضبطها بشكل آني أو لحظي؛ فهي تنتج: وتتبادل» وتدمج :وتسشتهلك وتعمل على 
السيانات الكبيرة )2014 111ء1»16). إن مثل هذه الدسيانات الكبيرة ET‏ فا شاملا ومتغرا 
و بدقة لهذه المدن والمدخلات للأنظمة التي من شأنها بناء أماكن أكثر ملاءمة للعيش, 
وامنة. ووظيفية: وتنافسية. ومستدامة (2013 101915610 :2013 Jis3 .(Hancke et al.‏ 
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هذه الرؤية للمدن الذكية يجري الترويج لها بشكل كبير من قبل عدد من أكبر مزودي 
خدمات البرمجيات في العالم وشركات الأجهزة الرقمية (على سبيل المثال» سيسكوء وآي بىي 
«el‏ ومايكروسوفتء. وإنتل» وسيمنزء وأوراكل» وساب) والتى اعتمدت بحماس من قبل 
المؤسسات البلدية والوطنية والعابرة للحدود التي تتوقع لتقنيات المدن الذكية أن تنتج 
تقدم اجتماعي-اقتصادي وتجدد امراكز المدنية لتصبح مراكز للابتكار والعمل Kourtit et)‏ 
2 .31). وفي حين تم بناء بعض مشاريع المدن الذكية من الألف إلى الياء (على سبيل 
JELI‏ سونغدو (00ع5028).: أو (Masdar City) juas disso‏ فإن معظم هذه المشاريع 
تدريجية» وتتألف من إعادة تجهيز للبنية التحتية القانئمة مع تقنيات رقمية وحلول للبيانات؛ 
لأن الوظيفة الرئيسية للبيانات الكبيرة في كلتا الحالتين هي توفير تحليلات بشكل آني أو 
لحظي لإدارة كيفية جوانب وظيفة المدينة وتنظيمها. 

لقد استخدمت هذه اطراقبة واليات تحليل السيانات الآنية واللحظية لعدد من السنوات 
في بعض القطاعات. على سبيل المثالء قيام العديد من المدن ببناء أنظمة النقل الذكية. 
والتي تستخدم البيانات الناتجة عن شبكة من الكاميرات والنواقل والمتعلقة بحركة ا مرور 
حول نظام ما لتقديم تغذية راجعة مركز تحكم مركزي. وتستخدم مراقبة وتنظيم التدفق, 
وتعديل تسلسل حركة المرورء وحدود السرعة المسموح بها.ء وإدارة العقوبات المتعلقة 
بالمخالفات المرورية بشكل تلقالى Abs .(Dodge and Kitchin 2007a)‏ فقد ترصد 
وتراقب الشرطة مجموعة من الكاميرات وسجلات الحوادث الحية من أجل توجيه ال موارد 
المناسبة لمواقع معينة للاستجابة السريعة وبكفاءة. كما يمكن جمع البيانات المتعلقة 
بالظروف البيئية من خلال شبكة استشعار موزعة في جميع أنحاء المدينة. على سبيل 
JELI‏ قياس وتتبع تلوث الهواءء ومستويات امياهء أو النشاط الزلزالي. وتستخدم العديد 
من الحكومات ال محلية نظم إدارية لتسجيل مشاركات الجمهور وتفاعله مع خدماتها. وفي 
جميع الحالات تقريباء كانت هذه الأنظمة معزولة عن بعضها البعض وتتعامل مع قضية 
واحدة ويتم التحكم بها من قبل وكالة واحدة. 

وفي الآونة الأخيرة. كانت هناك محاولة لجمع كل هذه الأنواع من امراقبة والتحليل في 
مركز واحد» وأن تستكمل باليات تحليل عامة ومفتوحة على نطاق أوسع. على سبيل «JUN‏ 
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قام مركز العمليات في ريودي جانيروء البرازيل» والذي تم إنشاءه بالشراكة بين حكومة 
المدينة وشركة آي بى أم: بتجهيز نظام على مستوى كافة أنحاء المدينة حيث يجمع البيانات 
من ثلاثين وكالة معا فى مركز موحد لتحليلات البيانات» ما ف ذلك حركة المرور والنقل العام 
والبلدية وخدمات المرافق» وخدمات الطوارئء» ونقاط جمع بيانات الطقس» والمعلومات 
المرسلة من قبل الموظفن والجمهور عر الهاتف» والإنترنت» والراديو (انظر الشكل 7.2 
2012c‏ 51118613). هناء تعمل الخوارزميات وفريق من المحللين على معالجة» وتصورء 
وتحليل» ورصد كميه هائله من بيانات الخدمة الحية» جنبا إلى جنب مع البيانات المجمعة 
مع مرور الزمن وكميات ضخمة من البيانات الإدارية التي تم إصدارها على أسس دورية 
بصورة أكبرء Us‏ ما يتم امزج بين مجموعات البيانات معا للتحقيق في جوانب معينة من 
حيةة المدينة والتغييرات الحاصلة فيها مع مرور الوقتء وبناء النماذج التنبئية فيما يتعلق 
بالتنمية والإدارة البومية للمدينة وإدارة حالات الكوارث كالفيضانات. ويكمل هذا عن 
طريق منصة العمليات الافتراضية التي تمكن المسؤولين في المدينة من تسجيل الدخول من 
الميدان والوصول إلى ال معلومات بشكل أني أو لحظي. فعلى سبيل المثال: Sce‏ للشرطة 
في مشهد الحادث ال مروري استخداع المنصة للعرفة عدد سيارات الإسعاف المرسلة للموقع 
وموعد وصولهاء وتحميل معلومات إضافية على .(Singer 2012c) x39‏ 5655 الهدف 
امعلن من عمدة امدينةء ادوارد بايس (Eduardo Paes)‏ هو إسقاط الحواجز بين الإدارات 
وضم سانات كل منها إلى الآخر ملمساعدة ال منظومة بأكملها .(Singer 2012c)‏ كما يجري 
تطوير مراكز مماثلة في أماكن أخرى. يصاحبها مجموعة من التطبيقات للمواطنين للوصول 
والاستفادة من بعض مناحي البيانات. 

أما بالنسبة لأولئك العاملين على تطوير واستخدام آليات تحليل متكاملة وآنية 
لبيانات المدينة» فإن مثل هذه المراكز والتطبيقات توفر وسائل فعالة لاستشعار وفهم 
العيش في ال مدينة وإدارتها في الوقت الراهنء وتصوّر وتوقع السيناريوهات المستقبلية: 
وإجراء توزيع ال موارد بالاعتماد على الدليل وتسهيل التفكير المترابط عبر الحكومة 
Kitchin 2014)‏ ;2013 11010:5). وبدلاً من اتخاذ القرارات استنادًا إلى الكلام 
المتداول: أو الحدس والظن. أو المحسوبية: أو أدلة دورية / جزئية» فمن ال ممكن تقييم 
ما يحدث في أىّ وقت. والرد والتخطيط ال مناسب له. 
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وعلاوة على ذلك» يوفر استخدام عينات كبيرة وربط أشكال متنوعة من البيانات 
تحليلا أكثر عمقاء وشمولية»ء وقوة. وقد أصبح من الممكن للدعاة لمثل هذه الأنظمة 
تطويرء وتشغيلء وتنظيمء وخوض غمار الحياة في المدينة على أساس قويء ودليل 
منطقى غير ضعيفء لا دليل انتقاني مبنى على اسس إيديولوجية سياسية Flowers)‏ 
23).. وهكذاء فثمة من يقولء إن استخدام هذه البيانات الكبيرة سيوفر الأساس 
ملدينة أكثر فعالية. واستدامة. وتنافسية: وإنتاجية: وانفتاحاء وشفافية. إلا أن آخرين 
يحذرون من أن البيانات الكبيرة تشير إلى احتمالات الوصاية "81704161 Big‏ ". وأشكال 
الحكم القائم على التقنية .(Technocratic)‏ وخصخصة (Corporatisation)‏ !853 
المدينة (انظر الفصل العاشر). 


الخلاصة: 

رسم هذا الفصل الدوافع الدعائية للبيانات الكبيرة فيما يتعلق بأربع مهام رئيسية 
هي: حكم الشعبه وإدارة ا منظمات» وتعزيز القيمة وإنتاج رأس امالء وإيجاد أماكن 
أفضل للحياة (حيث سديجري مناقشة إمكاناتها بالنسبة للعلوم في الفصل التالي). وقد 
بيّنت المناقشة الكيفية التي يتم بها تأطير البيانات الكبيرة سياسيًا واقتصاديا (انظر الفصل 
(Jal‏ وكيف يتم وضع مجموعة قوية من البيّنات والحجج العقلانية لدعم البدء في 
تنفيذ واعتماد تقنيات البيانات الكبيرة وحلولها. وتتضح قوة الأنظمة الخطابية التى 
يجري بناؤها من خلال النظر في الحجج المضادة - حيث من الصعب أن نقول إننا نريد 
أن نبقى ف حالة أقل تبضًرًا وحكمة: وإنتاجية. وتنافسية: وكفاءةء وفعاليةء واستدامة 
وأمنا... إلخ. فإذا كانت البيانات الكبيرة تقدم كل هذه الفوائد. فإن دعاة البيانات 
الكبيرة يجدون من غير المنطقي عدم المضي قدمًا في تطوير نظم البيانات الكبيرة ودعمها. 
وبطبيعة الحالء فإن الحجج التي قدّمت هي ضيقة وانتقائية وتبتعد عمدا عن تسليط 
الضوء على الآثار السلبية المحتملة فيما يتعلق بالحريات المدنية» ومراقبة البيانات» والفرز 
الاجتماعيء وأمن البيانات: وانفلات زمام التحكم وفرض السيطرة: والحكم الاستباقي؛ 
والحكم التكنوقراطي (القائم على التقنية) والخضخصة. وغلق التقنيات وعدم إتاحتها 
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بصورة أكبر (انظر الفصل العاشر). فهذه هى وجهة نظر أصحاب ال مصالح الخاصة:؛ ولا 
سيما آولئك الذين يسعون لبيع تقنيات البيانات الكبيرة. والحكومات التي تسعى نحو 
رؤية الليبرالية الجديدة للحكم والتنظيم (الليبرالية الجديدة: هي فكر أيديولوجي يمثل 
تأييد الرأسمالية ال مطلقة وعدم تدخل الدولة في الاقتصاد.). وليست وجهة نظر ال مواطنين 
أو المجتمعات التي من الممكن أنها لا تزال من دعاة البيانات الكبيرة والحوسبة في كل 
مكانء ولكنهم يتصورون أن استخدامها سيكون بطرق تحررية» وتمكينيه. وتشاركية مع 
إخضاع التأثيرات الأكثر سلبية للرقابة والتنظيم. 

لقد تميز التحليل المعروض في هذا الفصل بالإيجاز» مع توفير طمحه شامله لبعض الحجج 
التي تطرح. وما هو مطلوب ف الوقت الحاضرء من خلال دراسات الحالة اممحددةء هو 
تفصيل وتمحيص للأنظمة الخطابية التي تتكشف ويجري بناؤها. على سبيل ال مثالء فيما 
يتعلق بالترويج للبيانات الكبيرة في المدن الكبيرة. فهناك حاجة لرسم وتجزتة الكيفية 
التي تروج بها مختلف الخطابات الداعمة فيما يتعلق بأماكن محددة من خلال المجلات 
التجارية والمواقع الإلكترونية. والصحف اليومية: وامواد الترويجية للشركات. وسجلات 
الدولة: والبيانات السياسية... إلخ: وتقاطعات الأجندات المختلفة ومصالح ال معنيّين. وهذا 
يحتاج إضافة إلى تحليل الكيفية التي يتم بها التصدي ممثل هذه الخطابات برؤى بديلة: 
وتحليل المعارضات والتداغل بين الحجج الخطابية وتتبع:تسلسْل الكيفية التى تحولت 
بها مع مرور الوقتء والتحليل المقارن للمشهد الخطابي عبر مختلف البقاع: أن يصاحبه 
تحليل لآثار الخطابات على تشكيل الكيفية التى يعمل بها المجال في الممارسة والنتائج 
امترتبة على تنفيذ حل البيانات الكبيرة. 

وبالنسبة فيما يتعلق بالنقطة الأخيرة: ca Jb Salmon (2014) o‏ 43 مجرد آن یتم 
تطبيق حل قائم على البيانات فإنه من النادر أن يحقق الفوائد التي توقعها ا متحمسون 
والداعمون لذلك الحلء وغاليًا ما ينتج عن الحل مجموعة من القضايا الجديدة. وقال 
(Campbell's Law) L5 533 4255 4 3l‏ الذي صاغه عام الاجتماع دونالد كاميل 
(Donald T. Campbell (1976‏ ليشرح هذه الظاهرة. فقانون كامبل ينص على: "إنه 
كلما كثر استخدام أي مؤشر اجتماعي كمي لصنع القرار الاجتماعيء كلما كان الموضوع 
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تحت ضغوط الفساد وأكثر عرضة للتشويه وإفساد العمليات الاجتماعية التى يهدف 
إلى رصدها." أو بحسب صياغة سلمون نفسه: "كلما جرى تشغيل حقل بنظام ما بشكل 
أكبرء أوجد هذا النظام المزيد من الدوافع للجميع (الموظفينء والعملاءء وال منافسين) لتغيير 
سلوكهم بطرق منحرفة ضارة - مما يوفر أكثر من الشىء الذي تم تصميم النظام لقياسه 
وإنتاجه. سواء كان لذلك اي قيمة ق الواقع ام لا . 

وبعبارة أخرىء يبدأ الناس في اللعب على النظام بعقلانية واعتبار المصلحة الذاتية 
ولكن في كثير من الأحيان بطرق غير متوقعة لإفساد المقاييس» والخوارزميات» وعمليات 
صنع القرار الآلي. على سبيل المثالء أشار (44 :1995) 201161: إلى أنه "عندما يتم 
الحكم على مديري الأعمال من خلال حساباتهم: فإنهم يبدؤون التعلم على كيفية 
تحسين حساباتهم» رها من خلال بعض الحيل من قبيل تأجيل الصيانة اللازمة وغيرها 
من التكاليف ذات المدى الطويل". ونتيجة لذلكء. فإنه في حين يمكن أن تتحول كيفية 
إدارة وتشغيل المنظمات والحكومة: لتصبح قانمة على البيانات ومقاييس الأداء. فإنه من 
aS lod] xa dia VS LS] ss dubgza i9 degiza DT eS couoc aat‏ 
ليس بالضرورة أن تكون إيجابية في مجملها. 

ولذاء تحتاج دراسات البيانات الكبيرة وآثارها إلى الانفتاح لعرض السياسات والأجندات 
الكامنة للبيانات الكبيرة في مختلف السياقات وتوفير أساس لمزيد من المحادثات المعيارية 
حول هذا النوع من عواط البيانات الكبيرة التى قد نرغب ف العيش بها. فهذه الأنواع 
من المحادثات هى قيد التطوير في الوقت الحاضرء ويرجع ذلك بشكل جزن إلى حداثة 
التطورات وسرعة وقوعهاء وأيضا بسبب هيمنة الأطروحات المبالغ بها عن البيانات الكبيرة 
ومكائد أصحاب ال مصلحة ال معنيين بها. ومع ذلك. تضل الحاجة Js delà‏ هذه الأحاديث 
بالنظر إلى أن البيانات الكبيرة تعيد تشكيل الطريقة التي يجري بها حكم المواطنين؛ 
وتنظيم اممواقع» وإدارة المنظمات» وعمل الاقتصاديات» وممارسة العلوم. 
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الفصل الثامن 
إعادة صباغة بحوث agla)‏ والعلوم cae az VI‏ والعلوم الإنسانية 


The Reframing of Science, Social Science and) 


(Humanities Research 


في حديث لجلة الإيكونيميست في العام 2010 «e‏ ذکر سنان (Sinan Aral) Jl]‏ 
أستاذ إدارة الأعمال في جامعة 5555« 5l‏ "الثورات في العلوم غالبًا ما يسبقها ثورات في 
القباس" (مقتس عن 2010 111161)). إن هذا الفصل يستكشف مدى انطباق ملاحظة 
آرال فيما يتعلق بالبانات الكبيرة: والبنية التحتية للبيانات: والبيانات المفتوحة. وتآثراتها 
فيما يتعلق بكيفية مقاربة البحوث والاكتشافات الأكادمرة من منظور فلسفي ومنهجي. 
وعلى وجه الخصوص. يقوم هذا الفصل بدراسة كيفية تحذى توافر البيانات الكبيرة والبنى 
التحتية للبيانات إلى جانب الأدوات التحليلية الجديدة للنظريات والعلوم ا معرفية القائمة 
في مختلف التخصصات- الكيفية التي يتم بها طرح الأسئلة وكيفية الإجابة عنها- ويؤدي إلى 
نشوء محجالات وتخضصات جديدة. وهكذاء يستكشف هذا الفصل ما إذا كانت التغيرات 
التي تطرأ على الطريقة التي يتم بها إنتاج وإدارة وتحليل المادة الخام للمعلومات وا معرفة 
ستؤدي إلى تغيير جذري في فهم وممارسة المبادئ الأساسية التي تقوم عليها العلوم: والعلوم 
الاجتماعية والإنسانية. وبعبارة أخرى» هل تقود ثورة البيانات إلى نقلة نوعية في المجالات 
الرئيسية للعلوم والبحوث؟ 

LS (Paradigm) gòga! Jie‏ حدده كوهن (1962) ١ا‏ وسيلة مقبولة لاستجواب 
العالم وجمع المعرفة المشتركة بين نسبة كبيرة من الباحثين في اختصاص معين في لحظة زمنية 
معينة. ويتشارك الباحثون العاملون ضمن نطاق هذا النموذج في فلسفة Gals‏ واستخدام 
مجموعة من الأساليب الشائعة» وطرح الأسئلة والإجابة عنها للعمل على elo‏ المعرفة بصورة 
تدريجية. ومن ثمء فإنهم يميلون إلى تفضيل التصنيفات, وا معارفء والنظريات» والأساليب. 
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والأطر الأخلاقية والعقائدية نفسها أو القريبة من بعضها البعض. ومع ذلكء فقد أشار 
كوهنء وبصورة متكررة, إلى بروز طرق جديدة للتفكير تتحدى النظريات واطناهج المقبولة 
والمعمول بها. على «JEN Jes‏ فإن النظرية النسبية لآينشتاين جابهت» وإلى حد كبير. حلت 
محل نظرية نيوتن في الفيزياء. وباممثل» أحدثت نظرية التطور لداروين تغييرا جذريا à‏ 
الفكر النظري للعلوم السولوجيةء كما تحدت امذاهب الدينية في معتقدات النشوء والخلق. 
s‏ كلتا الحالتين. فقد تمسّك بعض الناس بالطرق المتبعة في التفكير وتشبثوا بها. في حين 
انتقل آخرون إلى الفكر الجديد. والذي سرعان ما أصبح الفكر المهيمن. وف بعض ال مجالات 
الأكادمية» هناك القليل من الأدلة على نماذج عاملة. لا سيما في العديد من العلوم الاجتماعية 
مثل علم الاجتماع والجغرافيا البشرية؛ حيث تمّ تطبيق مجموعة متنوعة من المناهج 
الفلسفية على سبل امثالء (Phenomenology) à ,2!54Jls (Positivism) dóg)l‏ 
والبنبوية «(Structuralism)‏ وما بعد البنيوية (20565)1:11]111:21151121)... وغيرهاء وقامت 
العديد من هذه ال معسكرات النظرية بطرح آراء متعارضة بشأن أفضل السبل لفهم العام. 
tr‏ مجالات أخرى؛ مثل العلوم: كان الاجتماع أكثر على وحدة المنهج العلمي ibl‏ معززا 
باختبار الفرضيات للتحقق منها أو نفيها. وهذا لا يعني: مع ذلك. عدم تحؤل أو تغير 
الطريقة التي تعمل على تصوير ونشر المنهج العلمي بشكل دوريء ووجود بعض النظريات 
ii alg tis diss od icd‏ فالتظريات مكين أن تُختلِف حول الظواهر 
ولكنها تشترك في نفس النهج الأوسع للمساعي العلمية. 

JE La ue «Cim Gray) sb ea» à 4-33‏ (كما هو مفصّل ف .21 ]© Hey‏ 
ess)! )5 155 (2009‏ من خلال أربعة نماذج. حيث أشار إلى أن النموذج الرابع ما زال في 
بداياته ولكن هو نتيجة لثشورة المعلومات المنتشرة (انظر الجدول 8.1). وبخلاف طرح 
كوهن» تحدث التحولات في النموذج لأن النموذج السائد في العلم لا يمكنه تفسير بعض 
الظواهر الممعينة أو الإجابة عن الأسئلة الأساسيةء ومن ثم تبرز المطالبة بإعادة صياغة 
آفكار جديدةء فتحولات غراى تأسست على التطورات الجارية ف آشكال البيانات وتطورات 
الأساليب التحليلية الجديدة. وسيستكشف هذا الفصل إلى أي مدى يأق وجود النموذج 
الرابع في العلوم: وإلى أي مدى تقود ثورة البيانات إلى نظريات معرفية بديلة في العلوم 
الإنسانية والعلوم الاجتماعية. وبالنظر إلى المراحل الأولية نسبيا في ثورة البيانات المنتشرة, 
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إعادة صياغة بحوث العلوم» والعلوم الاجتماعية» والعلوم الإنسانية 
oJ Le‏ تتفاجاً بتباين الآراء حول تأثير البيانات الكبيرة» والبيانات المفتوحة:؛ والبنى التحتية 
للبيانات» وتحليلات البيانات الجديدة على إنتاج نظريات معرفيهة جديدة» وسيستمر وجود 
مثل هذه التباين في الآراء. ولكنء لا مجال للشك ف أن البيانات الكبيرةء والبيانات المفتوحة. 
والبنى التحتية للبيانات» وتحليلات البيانات الجديدة تطرح قضايا معرفية أساسية وذلك 
لأن استخلاص المعلومات الصحيحة وال مفيدة من طوفان السانات لا يعد بساطة قضية فنية 
مكن التعامل معها من خلال حلول تقنية فحسب (2012 1101101). 
الجدول رقم ١(‏ - ^( 
مادج العلم الأربعة 
AE koe‏ 


الرابع العلوم الاستكشافية | يتسم بكثافة البيانات» الاستكشاف في الوقت الحالي 
الإحصان والتنقيب عن البيانات 








المصدر: تم التجميع من 2009 .Hey et al.‏ 


:(The Fourth Paradigm in Science) elxJ zJ! Jl e 554-7! 


في حين أن جيم غراى bl zga (Jim Gray)‏ النموذج الرابع في العلوم يتسم بكثافة 
البيانات واتساع المنهج العلمي المؤسس إلا أن بعض العلماء الآخرين يرون أن البيانات 
الكيرة أفسحت الطريق لبزوغ عصر ca (Empiricism) ds pol dà ula uas‏ 
Se‏ لحجم البيانات الذي تصحبه أساليب معينة أن يكشف عن الحقيقة الكامنة فيهاء وأن 
يمكن البيانات من أن تتحدث عن نفسها وهي متحررة من النظرية. وقد اكتسبت وجهة 
النظر الأخيرة الاعتمادية خارج المجمعات العلمية. وخاصة داخل دوائر الأعمال» ولكن 
أفكارها تأصلت وتجذرت في المجال الجديد لعلوم البيانات والعلوم الأخرى. فكلا المنهجين 
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يوفران تحديا للمنهجية العلمية التقليدية إضافة إلى طرح نموذج بديل محتملء وفي هذا 


:(The Re-Emergence of Empiricism) عودة ظهور الفلسفة التجرسة‎ 

بالنسبه للبعضء فإن فلسفة النموذج الرابع هي ما أطلق عليه Brooks (2013 a)‏ 
«منهج gag (Data-ism) «SbLJI‏ محاوله التقاط أي شىء على شكل انات واستخلاص 
مستوى معين من التبصر منها: "فأي شيء يمكن قياسه يجب أن يتم قياسه... البيانات هي 
منظور شفاف وموثوق يسمح لنا بتنقية العاطفية والأيدلوجية؛ إن البيانات ستساعدنا 
على فعل eL sl‏ رائعة - مثل التنيؤ با ملستقبل". ان من شأن مثل هذه الادعاءات المتعلقة 
بالبيانات أن تعزز كثيرا من الدعايات بشأن البيانات الكبيرة داخل مجتمع الأعمالء ويتم 
التعبير عنها بشكل عام من خلال الصياغة التجريبية - التي مكن لها من خلال الحجم 
الكافي للبيانات أن تعبر البيانات عن نفسها. ومثل هذه الفلسفة التجريبية متضمنة بشكل 
أمثل في ادعاءات )2008( Chris Anderson‏ وهو رئيس تحرير سابق في مجلة وآيرد 
(Wired)‏ والذي ضربت دعوته التأليبية بأن البيانات الكبيرة ما هي إلا مؤشر على "انتهاء 
النظرية' على وتر حساس للكثير من المعلقين. لقد ذكر 420161501 في مقطوعة استفزازية 
أن "طوفان البيانات يجعل ال منهج العلمى مهملا وأن الأماط والعلاقات المتضمنة داخل 
البيانات الكبيرة تقدم بشكل متأصل معرفة مهمة وثاقبة عن العمليات الاجتماعية 
والسياسية» والاقتصادية: والظواهر المعقدة. وقد أكد ذلك قائلا: 

هناك الآن طريقة أفضل. فالبيتابايت تسمح لنا بأن نقول: "إن الارتباط كاف" 

LS e أن نتوقف عن البحث عن النماذج.‎ LuS.es .(Correlation is enough) 

أيضا أن نحلل البيانات بدون أي افتراضات بشأن ما يمكن أن يظهره التحليل لنا. 

ويمكننا أن نرمي الأرقام في أكبر تجميعات الإحصاء التى شهدها العالم يوماء وأن 

ندع الخوارزميات الإحصائية تجد الأنماط إذا كان العلم لا يستطيع إيجاد هذه 

الأماط... فالارتباط يحل محل السببية» ويمكن للعلم أن يتقدم ويتطور حتى 

بدون النماذج المترابطة أو النظريات الموحدة: أو أي تفسير آلي على الإطلاق. لذاء 

لا يوجد أي سبب للتعلق بالطرق القديمة. 


le ثورة البيانات البيانات الكبيرة» والبيانات المفتوحة» والبنى التحتية للبيانات: والنتائج المترتبة‎ YYA 


7 


المكتبة الاقتصادية 
ECONLIBRARY — usan Lie duisoJ! 6G‏ © 


إعادة صاغة بحوث العلوم» والعلوم الاجتماعية»ء والعلوم الإنسانية 


وعلى نحو مشابه: أكد )2009( Je. Prensky‏ أنه "م يعد يتعين على العلماء الان القيام 
بتخمينات تنم عن الثقافة: أو أن يقوموا بتأسيس افتراضات ونماذجء ويختبروا هذه الافتراضات 
وتلك النماذج من خلال التجارب والأمثلة المعتمدة على البيانات. فبدلا من ذلك؛ يمكنهم 
التنقيب في المجموعة الكاملة من البيانات ioo‏ عن الأنماط التى تُظهر التأثيرات وتقدم 
النتائج العلمية بدون إجراء أي تجريب إضافي". ومن ثم فلقد كدت (2012) 1ء( آن: 
"التنقيب في البيانات الكبيرة يكشف العلاقات والأنماط التي لم نكن نعرفها كي نبحث عنها". 
واستمرت في الادعاء قائلة: "هذه الأنماط محددة للغاية وتبدو وكأنه تم التحكم في تحديدها 
من خلال الافتراضات". وبالمثل: أكد (2013) 5]620232: على ما يلى: 


يتيح منهج البيانات الكبيرة تجاه جمع المعلومات المبني على المعرفة للمحليين 
الحصول على القرار الكامل فيما يتعلق بالشئون عاطية النظاق. فلا يتم فقد أي 
شيء عند النظر عن قرب بالغ إلى جزء واحد محدذ من البيانات؟ ولا يتم فقد أي 
شىء عند محاولة الحصول على منظور واسع للغاية بشأن موقف حيث تم فقدان 
التفاصيل الدقيقة. فالخوارزميات تجد الأنماط في حين أن الافتراضات تتبع من 
البيانات» ولا يجب على المحلل أن يزعج نفسه حتى بطرح افتراض بعد الآن. لقد 
تحول دورها من دور استباقي إلى دور تفاعليى. حيث إن الخوارزميات هى من 
تقوم بالعمل السياقي... فالخوارزميات ستقوم بتحديد الأماط ثم تقوم بوضع 
النظريات, ولذا فهناك حاجة متناقصة للقلق بشأن وضع افتراض في البداية ثم 
اختبار هذا الافتراض من خلال عينة من السانات. 
ونعبارة أخرق::فيذلا من اختار إذا ماكانت يعض BUM‏ المفترضة اللعينة أو العلاقات 
توجد داخل مجموعة بيانات» فإن الخوارزميات مصممة للعمل على البيانات الكبيرة من 
أجل اكتشاف ارتباطات ذات دلالة بين البيانات دون أن يتم توجيهها من قبل الافتراضات. 
وكما :Croll (2012:56) Jl8‏ "في النموذج القديم المتسم بندرة البيانات: كان يتعين علينا 
أن نقرر ما الذي ينبغي جمعه أولا ثم نقوم بجمعه. أما مع النموذج الجديد المتسم بوفرة 
البيانات. فنحن نقوم بالجمع أولا ثم نسأل الأسئلة لاحقا". 
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إن الأمثلة المستخدمة فى توضيح مثل هذا الموقف عادة ما تكون نابعة من التسويق 
والتجزئة. فعلى سبيل المثال» وصف (2012) 109126 حالة سلسة تجزئة حيث قام بتحليل 
صفقات الشراء لمدة اثنى عشر عاما من أجل ملاحظة العلاقات المحتملة غير الملحوظة بين 
المنتجات التى انتهى بها الأمر في سلة المشتريات للمتسوقين. وقد أدى اكتشاف الارتباطات 
بين البنود المعينة إلى تعيين الأماكن الملائمة للمنتج الجديد وإجراء بعض التعديلات على 
إدارة مساحة الأرفف مع زيادة تبلغ 17* في الإيرادات لكل حقيبة تسوق في الشهر التجريبي 
الأول. لم تكن هناك أي افتراضات بأن المنتج (س) على سبيل المثال غالبا ما يتم شراؤه مع 
المنتج (ص) والتي تم اختبارها فيما بعد. لقد تم بكل بساطة طرح بعض التساؤلات بشأن 
البيانات من اجل اكتشاف ماهية العلاقات الموجودة التى لم يكن من ال ممكن ملاحظتها في 
السابق. وبالمثل» فإن نظام التوصيات في موقع أمازون يقدم اقتراحات بشأن منتجات أخرى 
من الممكن أن/يكون المتسوق مهتماً بها دون معرفة أي:شيء عن ثقافة أو تقاليد الكتب 
والقراءة لذلك المتسوقء فهذا النظام يحدد. ببساظة: أنماط الشراء عبر العملاء» وذلك من 
أجل تحديد ما إذا كان الشخص (س) يحب الكتاب (ص).: فمن المحتمل أنه سوف يحب 
الكتاب (ز) وذلك بالنظر إلى الأنماط الاستهلاكية له وللآخرين. 


ويزعم Dyche‏ أن هذا امنهج امفتوح للاكتشاف» بدلا من أن يكون موحهاء يعد أكثر 
احتمالية لكشف الأماط الضمنية غير المعروفة: وذلك فيما يتعلق بسلوكيات المستهلك. 
والعلاقة بين المنتجات. والمخاطر المالية» والتى يمكن الاستفادة منها لاحقا. وفي حين أن 
من ال ممكن أن يكون من ال مفضل توضيح أي ارتباطات موجودة داخل البيانات وما السبب 
في كون هذه الارتباطات ذات AY‏ فإن مثل هذا التفسير يعد غير ضروري بشكل كبير 
فالمهم هو معرفة أنه يفعل ذلك. ومن تم فلقد ادعى )90 :2013( lia) Siegel‏ هو 
تأكيدي) فيما يتعلق بالتحليلات التنبئية: "نحن في العادة لا نعرف عن السببية» ونحن في 
الغالب لا نهتم بذلك بالضرورة... إن الهدف يركز بشكل كبير على التنبؤ أكثر من تركيزه 
على فهم العام... إنه بحاجة إلى أن ينجح فحسب إن التنبؤ يفوق التفسير". وكما ادعى 
Weinberger (2011: 33(‏ فما یتعلق بهنش (Hunch)‏ وهو موقع شبئى يقوم بتقديم 
توصيات بناء على الإجابات عن الأسئلة التي يبدو أنها لا ترتبط ارتباطا وثيقا بالأسئلة 
الأصلية التى تم توجيهها: 
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إن التحليل لا يدعم النظرية وهو لا يقدم أي نظرية. لا توجد لدى موقع 
هنش (110122) أي فكرة م أن الناس الذينء: على سبيل المثال: يفضلون ارتداء 
صندل على الشاطئ والذين م يقوموا بنفح الهندباء (نبته بريه) في العام الماضيء 
رما يحبون هذه الأفلام الأربعة (التى تم اقتراحها لهم). فالموقع لم يكن لديه أي 
افتراض» وم يكن لديه أي تخمين. كل ما كان لديه ارتباط إحصاقي فحسب. 


إن بعض برامج تحليلات البيانات يتم بيعها من أجل هذا التصور بالضبطء فعلى 
سبيل امثالء. فإن البعض يدعي ol‏ برنامج التنقيب عن البيانات والعرض البصرى اياسداي 
((Ayasdi)‏ لديه القدرة على اكتشاف الرؤى بشكل الي بغض النظر عن التعقيد ودون 
توجيه أي أسئلة. ويمكن لعملاء آياسداي أن يتعلموا jasi‏ | الإجابات عن الأسثلة التي م 
يكونوا يعرفون أن يسألوها في المقام الأول. ولعرض الأمر بصورة مبسطة» فإن آياسداي هو 
«سرنديبية رقمية» بمعنى أن آياسداي لديه القدرة على اكتشاف الأشياء المفيدة مصادفة 
(من أسطورة أمراء سرنديب الثلاثة)(2013 US de Neg (Clark‏ فهناك من يدعي أن 
آیاسدای آزال بشكل كلي دور العنصر البشري في عملية التنقيب عن البيانات - ؤمن ثم 
فلقد أزال جميع التحيزات البشرية AL‏ اله وندلا من انتظار أن يتم توجيه سؤال 
إليه» أو أن يتم توجيهه إلى روابط بيانات موجودة معينةء فإن النظام سوف يقوم وبدون 
توجيه باكتشاف الأنماط التي رما لمم يفكر المتحكم البشري أن يبحث عنها )2013 (Clark‏ 

إن هناك مجموعة قوية وجذابة من الأفكار التي تعمل في مثل هذه المجادلات والتي 
تجري على نحو متضاد مع ال منهج الاستدلالي المسيطر وا مهيمن داخل العلوم الحديثة. أولا: 
أنه يمكن للبيانات الكبيرة أن تلتقط ا مجال بالكامل وأن تقدم قرارا كاملا. Lob‏ أنه لا توجد 
هناك حاجة للنظرية: أو ghill‏ أو الافتراضات الاستناطية. ثالثا: أنه من خلال تطبيق 
تحليلات البيانات بدون دراية مكن للبيانات أن تتحدث عن نفسها وهي متحررة من 
الصياغة والانحياز البشريينء si olg‏ أنماط أو علاقات داخل البيانات الكبيرة تكون صادقة 
وهادفة بشكل أصلي. راضاء أن المعنئ يعهلوة السناق أه المدرفة المرقطة باللضال. 


فهده الأمور تعمل سويا لى ده تشير إلى أن هناك أسلونًا جديدا في العلوم يتم تأسيسه. 
وهو الأسلوب الذي تكون فيه طريقة العمل استقرائية بطبيعتهاء وبمثل هذا ادعى 


ثورة البيانات البيانات الكبيرة: والبيانات المفتوحة:» والبنى التحتية للبيانات» والنتائج المترتبة عنها ev‏ 


AZ 


المكتبة الاقتصادية 
قناة المكتبة على ECONUBRARY phasi‏ @ 


الفصل الثامن 


Gannon and Reid (2009)‏ أن 'التوافر الجاهز ف البيانات المتعددة يحول ال مناهج 
العلمية من الطريقة العلمية التقليدية التي تقودها الافتراضات إلى العلوم المعتمدة على 
الاستكشاف". وبامثل. يقترح (127 :2011) 1112181 أن الهدف التقليدي للعلوم 
المتمثل في تكوين النظريات التي تدعمها الحقائق وتفسر الحقائق في الوقت ذاته يتحول 
في الوقت الراهن إلى "تقديم نماذج معقدة تفسر العلاقات المعقدة" حيث "في بعض 
اا alls sa Mass duse ê as sg a aS aa a‏ 
هناك ارتباط قوي ملاحظ بين المحاكاة والعام الحقيقى والذي هنح الثقة بآن المحاكاة 
الأخرى سوف تقدم نتائج موتوقة". وقد ستخدم 1/11101861/ ال مثال المتعلق بوضع 
عمود على بعد متر واحد أمام أحد الأبواب ف برنامج محاكاة لتدفق خروج الناس في حال 
الإخلاء والذي أدى إلى تدفق أفضلء ولكن دون وجود أي تفسير من النموذج للسبب الذي 
يجعل العمود يفعل ذلك. واقترح» بطرق أخرى متعددة: أننا لسنا بحاجة لأن نعرف السبب. 
وإنما نحتاج لأن نعرف أن العمود يفعل ذلك وأن تطبيق الفكرة سوف يساعد على إنقاذ 
حياة التاس» وقد أنتج هذا ل )26 :2013( dJL- Andrejevic‏ تسمى "المعرفة بدون الفهم"'. 


مغالطات الفلسفة التجريبية :(The Fallacies of Empiricism)‏ 
لا يوجد هناك أي شك بأن البيانات الكبيرة لديها. وسوف يكون لديها بشكل متزايد. 
تأثير على كيفية ممارسة وفهم العلوم. وعلى الرغم من ذلكء فإن رؤية الفلسفة التجريبية 
بشأن كيفية تكون هذا العلم الجديد تعتمد على التفكير المغالط - جميع الأفكار الأربع 
التي تعزز تشكيلها مشكوك فيها. فلربما تكون هذه الأفكار جاذبة بشكل كبيرء ولكن 
التدقيق النقدي والفلسفي يكشف مشاكل خطيرة مع كل فرضية. إن من المهم أن يتم 
التحقق من كل فكرة. كل بدروهاء قبل صياغة رؤية بديلة للعلم الذي تقوده البيانات 

والذى مزج بين سمات الإبعادء والاستقراء والاستنتاج. 

أولا: مكن للبيانات الكبيرة أن تلتق ط اممجال بالكامل وأن تقدم قراراً كاملا. حيث إن 
البيانات الكبيرة تكافح من أجل الشمولية» فمناصروها يدعون آنه من الممكن رؤية كل شيء 
داخل المجال (على سبيل المثال جميع الأنشطة على موقع تويتر, أو جميع عمليات الشراء داخل 
سلاسل امتاجر الكبيرة)» وأنه من الممكن أن نفهم بشكل كامل ما نراه (2013 1715). وعلى 
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الرغم من ذلكء وكما ناقشنا في الفصول Ys ١‏ 5 فإن البيانات الكبيرة رها تسعى إلى أن تكون 
شمولية: ولكنها تشكل كلا من التمثيل والعينة. فالواقع: أن جميع البيانات تقدم رؤى بصرية 
قليلة للعام؛ وليس رؤى شاملة: أي رؤى من وجهات نظر duszo‏ باستخدام أدوات usa‏ 
وذلك بدلا من رؤى بصرية شاملة .(Haraway 1991; Amin and Thrift 2002) (1525 Y‏ 
وعلاوة على ذلك» فإن امجالات تتطور وتتغير» ومن ثم فإن البيانات الكبيرة ليس بإمكانها 
الوصول إلى كل مكانء وذلك يرجع من ناحية إلى أن البيانات الكبيرة لا مكنها الإلمام بجميع 
الأماكن والأزمنة» ومن ناحية أخرى؛ فإن الكثير من الأماكن والأزمنة الجديدة تبقى كي يتم 
اختراعها (128 :2002 †؟1hri .)Amin and‏ وعلى هذا النحوء تشكل البيانات الكبيرة "سلسلة 
من الأوامر الجزئية والكليات الممتمركزة» مع مقدرتها على التحديق في بعض الاتجاهات دونا عن 
الأخر ى Latour)‏ واممقتبس 3( 92 :2002 (Amin and Thrift‏ ومن ثم فلقد استنتج (115 
3 "أنه من المهم أن نتذكر أن ما نراه تتم صياغته من قبل ما نحن قادرون على رؤيته أو 
في الواقع ما نريد رؤيته من خلال إطار عمل فكري محدد . 

ثانيا: أنه لا توجد هناك حاجة للنظريةء أو النماذج أو الافتراضات الاستنباطية. الافتراض 
هنا هو أن تكوين البيانات وتحليلات البيانات واللذان يعززان استخدام البيانات الكبيرة 
يبدو أنهما يأتيان من لا شيء» وآنهما بشكل ما متحرران من "القوة التنظيمية للفلسفة" 
(861982011:8). فالأنظمة المتناقضة تصمم من أجل التقاط أنواع معينة من السانات» 
LÈ‏ ما يحصل ذلك من أجل أغراض محددة للغاية: وأن التحليلات والخوارزميات اللتبن 
تدعمان البيانات الكبيرة تعتمدان على الاستدلال العلمي وأنه تم صقلها من خلال الاختبار 
العلمي. فالعديد من الأفكار المستخدمة في تصميم نظم البيانات الكبيرة مستمدة من 
الأدبيات العلمية واسعة النطاق والتجارب وال معارف لهؤلاء الذين يعملون على النظام. 
إن هناك الكثير من الوقت ال مستنفد في اختيار واختبار طرق متعددة لتحديد واستخلاص 
القيمة من البيانات المنتجة. وتقييم النتائج وتطويع التحليلات. وهناك جدول أعمال 
يقود مثل هذا العمل وذلك فيما يتعلق بمماهيه النتائج المرجوة (زيادة دوران m‏ امال أو 
الأرباح» أو فهم نظام معينء eJ]‏ والذي يستفيد من النظريات المبرهنة, وذلك فيما يتعلق 
ماهية الطرق ال ملحوظة لتحقيق مثل هذه التأثرات» وما إذا كانت مثل هذه التأثرات 
تحدث ف الواقع ثم يتم اختبارها بعد ذلك. 
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وكما أشار (2012) 1.6021[11آ: فإن الإستراتيجية الاستقرائية لتحديد الأنماط داخل 
البيانات عادة ما يقودها الاستدلال العلمي: وهي لا تحدث فراغا علميًا. أو كما ذكر 
Quintero (2012)‏ "لا يمكن تقديم التفسيرات ببساطة من التحليلات الإحصائية. وذلك 
دون الحاجة إلى نظرية سابقة من نوع ما". وقد أتبع ذلك قائلا: "كونك منقادا بالسانات 
يعد أمرا مفيدا فحسب إذا كان لديك نظرية قوية يمكنك من خلالها أن تستمر في طريقك. 
ان " شىء اخر سوف دتركك متجها الى منحدر دون أن ol göl "ol‏ كلا من الاستدلال 
الاستنتاجي والاستقراني يتم تشكيلهما lis‏ بشکل استطرادی ولا y os lan Ls‏ 
شيء. ومن ثم فقد اقترح )1979( Popper‏ مقس من (74 :2012) أنتنوط»211© أن 
جميع العلوم تطبق منهج الأضواء الكاشفة على الاكتشاف العلميء حيث يكون تركيز 
0 منقادا من خلال النتائج السابقة والنظريات والتدريب» وكذلك من خلال التخمين 
المؤسس على التجارب وال معارف. إن الأمر ذاته ينطق على أمازون ¿aag (Amazon)‏ 
(Hunch)‏ واياسداي Äl LASI .(Google) | L2 325 (Ayasdi)‏ اعتمد عليها أمازن 
في بناء نظام التوصيات على الاستدلال المنطقيء كانت معززة من خلال نموذج إرشادي 
يرافقه اختبار تجريبي تم تصميمه من أجل تحسين أداء الخوارزميات التي يستخدمها. 
lbg‏ فإن جوجل يقوم ببحوث وتطوير واسع النطاقء. وهو يعمل بالشراكة مع العلماء 
ويشتري ال معرفة العلمية. سواء تم هذا من خلال تمويل البحوث داخل الجامعات أو من 
خلال شراء المعرفات الإلكترونية للشركات الأخرى. وذلك من أجل تنقية وتوسيع ا منفعة 
بشأن كيفية تنظيمه» وتقدهه» واستخلاصه للقيمة من البيانات. ونتيجة لذلك» فإذا وجدت 
الخوارزميات الإحصائية أنماطا ف البيانات» فإن ذلك يعود إلى أنه تم استخدام علم التعرف 
على الأتماط: جنباً إلى جنب مع المعرفة الخاصة بالمجال. 
ثالثا: يمكن للبيانات أن تتحدث عن نفسها وهي متحررة من الصياغة والانحياز البشريين. 
إن المفهوم القائل بأن إنتاج المعرفة من البيانات الكبيرة يحدث بشكل غير مرتبط بالعلم: 
هو على علاقة بالفكرة القائلة بأن تحليلات البيانات الكبيرة تمكن البيانات من التحدث عن 
نفسهاء وهي غير مثقلة بالسياقية أو أهواء التوضيح البشري. فليس فقط إنتاج البيانات 
هو ما يتم بشكل افتراضي ومتحرر من النظرية» فحتى تفسير ومعاني تلك البيانات يمكن 
بطريقة مشابهة أن يحدث في فراغ epale‏ فمثل هذا المفهوم يعد سمة من سمات التفكير 
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التجريبي» وهو أنه عندما يتم تقديم وتحليل البيانات بطريقة ملائمة: فإن البيانات» بنفسها 
ومن نفسهاء تشكل دليلا ملحا يرتبط بظاهرة أو عملية معينةء بدلا من تفسيرها. وفي حالة 
البيانات الكبيرة. فإن حجم البيانات يضيف إلى أهمية الدليل. فهذا "التقديس" للبيانات 
يكن أن 45585 (JI Jenkins (2013) (423! B5‏ حتمية البيانات في المناقشات التي تتم 
من أجل البيانات الكبيرة. وهذا يعني أن البيانات تتفوق على النظرية» وأن البيانات أمر 
حقيقيء في حين أن النظرية ليست حقيقية (2013 113165): وأن البيانات تقول الحقيقة في 
حين أن النظرية مجرد تلفيق. وهناء يوجد ثلاث قضايا يتعين التفكير فيها: القضية الأولى 
هي افتراض أن البيانات موضوعية» ومحايدةء ومتحررة من التحيز البشري. القضية الثانية 
أن الأنماط والعلاقات داخل البيانات الكبيرة هادفة وصادقة بشكل متأصل. القضية الثالثة 
أن تفسير مثل تلك الأنماط والعلاقات يفتقر إلى أي نوع من الوضعية والموقعية. 

وكما ناقشنا فى الفصل الأولء فإن البيانات ليست ببساطة عناضر محايدة أو طبيعية 
بحيث يتم فصلها عن العام بطرق محايدة وموضوعية. ويمكن قبولها بالقيمة الاسمية. 
فالبيانات لا توجد قبل تكوينها ولا تنشأ من أي شيء. ولكن الأحرىء» أن البيانات يتم إنشاؤها 
داخل مجاميع البيانات ال معقدة التي تشكل تركيبها بشكل فعالء ولا يمكن للبيانات في هذه 
الحالة التحدث عن نفسهاء ولكنها على الدوام تتحدث. بشكل متأصلء من وضعية معينة 
(Crawford 2013)‏ وعلاوة على ذلك« فان |lEoء‏ )2008( ob Anderson‏ الارشاط يفوق 
السببية يشير إلى أن الأنماط الموجودة داخل مجموعة البيانات ذات معنى بشكل متأصل. 
وهذا افتراض يعرف جميع الإحصائيون المدربون أنه خطر وغير صحيح. فالارتباطات بين 
المتغيرات داخل مجموعة البيانات يمكن أن تكون عشوائية بطبيعتها ويوجد بينها ارتباط 
عرضي قليلء أو لا يوجد هذا الارتباط على الإطلاق (انظر الفصل التاسع). إن تفسير أي 
ارتباط على أنه ذو مغزى رما يؤدي في هذه الحالة إلى مغالطات بيئية خطيرة. ويمكن أن 
يتفاقم هذا الأمر في حالة البيانات الكبيرةء وذلك يرجع إلى كون الموقف التجريبي يظهر 
وكأنه يعزز ممارسة تجريف البيانات - البحث عن أي ارتباط - ومن ثم يزيد من احتمالية 
اكتشاف ارتباطات عشوائية. وعلى الرغم من «S5‏ ففي حين أن التعرف على الأنماط 
ربما يحدد علاقات شيقة محتملة: إلا أن صحة هذا الأمر تستلزم اختباره على مجموعات 
بيانات أخرى وذلك من أجل التأكد من مصداقيتها وصحتها. وبعبارة أخرىء يتعين أن 
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تشكل العلاقات أساس الافتراضات التى يتم اختبارها على نطاق أوسع: والتى تستخدم بعد 
ذلك من أجل بناء وصقل النظرية التي تفسرهاء ومن ثم فإن الارتباطات لا تفوق السببية» 
ولكنها بالأحرى يجب أن تشكل أساس بحوث إضافية من أجل معرفة ما إذا كانت مثل 
هذه الارتباطات دالة على JI‏ 35( هذه الحالة فقط يممكننا أن ندرك مدى مغزى أسباب 
الارتباط. 

وفي حين أن الفكرة القائلة بأن البيانات تتحدث عن نفسها وهي متحررة من التحيزات 
أو أن الصباغة رما تبدو وكأنها فكرة جاذبة: إلا أن الواقع مختلف إلى حد ما. فبحسب ما 
أشار )166 :1981( Gould‏ فإن "البيانات غير الحية لا ممكنها أبدا أن تتحدث عن نفسهاء 
ا نحاول أن نوجه بعض إطار العمل ال مفاهيمي: asia ha‏ توكلا ضور 
el a a‏ مركبًا بشكل محكم ومنهجيء نحو مهمة الاستقصاءء والتحليل» والتفسير". 
فهم البيانات lag‏ مؤطر؛ ويتم فحصها من خلال منظور معين o‏ 
وحتى لو كانت العملية مؤتمتة بطريقة ماء فإن الخوارزميات المستخدمة لمعالجة البيانات 
عادة ما تكون متشبعة بقيم معينة وتكون مقترنة بالسياق داخل منهج علمي معين. 
وكما أوضح )2013( oól$ :Hales‏ "أي اختبار إحصانى أو a) la?‏ تعلم الي تعبر عن 
منظور ماهية النمط أو النظام.. . فأحد الخوارزميات سوف تحجد نمطا ماء في حين تجد 
خوارزمية أخرى شيئا اخر" . فإذا ترجم ذاك شخص ماء فسيكون من ال محتم اق AA‏ 
من معرفته؛ ومهاراته. وحدذسه المتراكم من أجل تنقية رؤاه. حتى يقوم محلل مختلف 
بطرح نتائج مختلفة من نفس التحليلات. فالفهم أو التفسير يتشكل فى العادة من خلال 
أعين ال مشاهدين بغض النظر عن ادعائهم أنهم محايدون أو متحررون من القيمة الناتجة: 
وعلاوة على ذلك» فإن التفسيرات ليست ثابتةء فهي تتغير كلما تعرضت إلى معارف جديدة 
من خلال بحوثء أو مناقشات: أو مجادلات إضافية. وعلى هذاء فإن السانات لا تتحدث 
عن نفسها أبداء وكما ادعى (9 :2012) 511962: "نحن نتحدث بالنبابة عن السانات". 

رابعا: المعنى يتجاوز السياق أو المعرفة المرتبطة با مجال. إن من الجوانب المرتبطة 
بالفكرة القائلة بآن البيانات تتحدث عن نفسه ال مفهوم القائل بأن تفسير البيانات الكبيرة 
لا يتطلب معرفة سياقية أو مرتبطة مجال معين. وبدلا من ذلك فالمهم هو المقدرة على 
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توضيح ال معنى داخل البيانات. فبسبب أن البيانات من المفترض أن تتحدث عن نفسهاء 
يمكن لأى شخص ذو فهم معقول بالإحصاء أن يكون قادراً على تفسيرها. إن هناك شكوكا 
قليلة فيما يتعلق بأن علماء البيانات والحاسب والعلماء الآخرين يتحركون داخل نطاق 
تخصصات بعضهم البعض مع انتشار البنى التحتية للبيانات والحوسبة. وف الكثير من 
الحالات» فإنهم لا يقدمون آدوات جديدة فحسب» ولكنهم يشتركون بفعالية في تفسير 
البيانات. ومع ذلكء فإن هؤلاء العلماء لديهم القليل من الفهم المعمق ف ال مجال المناط بهم 
وكذلك بالنظريات التجريبية المتعمقة والمعارف التي تم تأسيسها عبر فترات زمنية طويلة. 
فعلى سبيل المثال» فيما يتعلق بالعلوم الاجتماعية والإنسانية» فإن الأساليب الجديدة من 
التحليلات والبنى التحتية للبيانات توجه من قبل علماء الحاسب والفيزياء. وفي الغالب 
تجعل النتائج أولئك ام متشربين لوجهة النظر التخصصية يستسلمون وينقادون لهذه النتائج. 

ولتوضيح هذا الجانبء فإن المجال الناشئ للفيزياء الاجتماعية. والذي من خلاله يقوم 
الفيزيائيون وآخرون باتخاذ قرارات بشأن العمليات الاجتماعية والمكانية e slo‏ تحليلات 
البيانات الكبيرة. وخاصة تلك المتعلقة بالمدن والقوانين المفترضة التي تعزز صياغتها 
«(Bettencourt et al. 2007;Lehrer 2010; Lohr 2013) L.4350555‏ غالبا مابيتجاهل 
عن عمد ثقافة علم الاجتماع الممتد لقرنين من الزمان. ويشمل ذلك تجاهل التحليلات 
الكمية والنماذج المبنية لما يقارب قرنا من الزمان. والنتيجة هي تحليل المدن الذي يكون 
اختزالنا إل عند كبرء وتفعيا و يتجاهل كأثيرات الثقافة. والسياسنة, والحوكمة زاس «JU‏ 
وتقاليد ثتريه من العمل الذي سعى نحو فهم كيفية عمل ال مدن من النواحي «e zo Vl‏ 
والثقافية» والسياسية؛ والاقتصادية والنتيجة إعادة إنتاج الأنواع ذاتها من أوجه القصور التي 
أوجدتها العلوم الاجتماعية الكمية / الوضعية في منتصف القرن العشرين );2914 Kitchin‏ 
Wc lاذھو‎ .(Mattern 2013‏ يتعدى حدود التقاليد المتنوعة والثريه للإرت الفلسفي 
ويعمل على تعزيز المناهج الفلسفية التجريبية والوضعية بصفتها أفضل وسيلة لفهم المدن 
مع آنه من المحتمل آلا يتفق مع هذه الرؤية النظرية إلا القليل جدا من العلوم الاجتماعية 
التي تلت عصر الفلسفة الوضعية (2013 .)Kitch1٢‏ 
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إن هناك مجموعة متشابهة من ال مخاوف لدى أولئك العاملين في مجال العلوم. 
فقد أشاز (2012) :50135561 عاى سسيل JUI‏ إلى أنه في العلوم البيولوجية: ادعى 
متخصصو العلوماتية الحيوية الذين لديهم أسلوب معين وضيق للغاية لفهم علم 
الأحياء. أن الأرض كان يسكنها في السابق الأطباء السريريون وعلماء الأحياء التجريبيون 
والجزيئيون. وأشار إلى أن: "تحويل التحليل إلى البيانات الرقمية... يفسح ال مجال أمام 
الأسئلة المعرفية كتلك المتعلقة بمن بملك الشرعية ليكون منتجا للمعرفة- المهتم بالآثار 
(أو الطبيب السريري أو عاط البيولوجيا الجزيئية) أو الإحصائ الذي يحلل البيانات 
ويقدم ال محاكاة أو النموذج (2012: 7). ومن ثم فإن بعض علماء البيانات بدون شك 
يتجاهلون ملاحظات )2013( .Porway‏ وهي: 

بدون توافر خبراء في موضوع البحث من أجل توضيح المشاكل مسبقاء فسوف 
نحصل على نتائج ضعيفة... وبدون شك فإن هناك حاجة إلى خبراء قي موضوع 
البحث من أجل تقييم نتائج العمل وخاصة عندما يتعامل الفرد مع بيانات حساسة 

عن السلوك البشري. وبوصفنا علماء بيانات» فنحن مؤهلون بشكل جيد للتعامل 

مع ماذا فيما يتعلق بالبيانات. ولكن لا يجب علينا إلا فيما ندر التعامل مع سؤال 

الماذا" فيما يتعلق با موضوعات التي لا نكون خبراء فيها. 

وكما أشار (إ20103. فإن المطلوب بالفعل هو أن يعمل علماء البيانات وخراء 
النطاق مع بعضهم البعض من أجل التأكد من أن تحليلات البيانات ا مستخدمة مفهومة 
وأن النتائج من مثل هذه التحليلات يتم تفسيرها بعقلانية وسياقية. وبالمثل: يدعو 
Lazer et al. (2009: 10 - 11)‏ إلى التعاون بين علماء الاجتماع الضالعين ا وبين 
i53! «Jis (Slezs a3 (11 — 10 :2009) «as Lolo cus LAJl c ulodl elle‏ 
Minelli et al. (2013)‏ !5 فرق علماء البيانات ينبغي أن يعملوا مع خبراء عمليات 
الأغيال هن لحل الإتكفاذق هت البؤى التامنية (أقظر أنه الحيول 4-7 


العلم المقاد بالسيانات (ءععمعك5 :(Data-driven‏ 
يسعى العلم المقاد بالبيانات. بدلا من كونه متجذراً ف الفلسفة التجريبيةء إلى التمسك 
بمعتقدات الطريقة العلمية: ولكنه أكثر انفتاحا لاستخدام مزيج مختلط من المناهج 
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الاستدلاليةء والاستقرائيةء والاستنتاجيةء من أجل تطوير فهم الظاهرة. وهذا يختلف عن 
التصميم الاستدلاني التجريبي التقليدي في أنه يسعى إلى طرح افتراضات ورؤى يتم توليدها 
من السانات بدلا من تولبدها من النظريات )613 :2009 6jLsos .(Kelling et al.‏ 
آخرى» فهو يسعى إلى دمج أسلوب من الاستقراء في تصميم البحوثء» وذلك على الرغم 

V NT‏ الشرح من خلال الاستقراء ليس هو الغاية المستهدفه (كما هى الحال مع اممناهج 
التجحرسة). وبدلا من ذلك. فهو يشكل [aso bd‏ من أساليب توليد الفرضيات قبل 
استخداه المنهج الاستنتاجي. ولا تنشأ عمليه الاستقراء من لا شيء. ولكنها تقع وتقترن 
بسياق نطاق نظري متطور للغاية. ومن ثمء فإن الإستراتيجية المعرفية المتبناة داخل العلم 
lil‏ بالبيانات هي استخدام أساليب موجهة لاكتشاف المعرفة من أجل تحديد الأسئلة 
(الافتراضات) المحتملة الجديرة باختارات وبحوث اضافية. 


فالعملية يتم توجيهها من ناحية أن النظرية الحالية تستخدم من أجل توجيه عملية 
اكتشاف المعرفة: وذلك بدلا من أن نأمل ببساطة أن نحدد جميع العلاقات داخل مجموعة 
البيانات وأن نفترض أنها ذات معنى بطريقة أو بأخرى. ومن ثم فإن كيفية تكوين 
البيانات أو إعادة تحديد الغرض منها تقوده افتراضات معينة تعززها خيرات ومعارف 
عملية ونظرية؛ مثل ما إذا كانت التقات وإعدادها سوف تلتقط أو تنتج مواد بحثية 
مفيدة وملائمة: فبذلاً من إنتاج البيانات بأي وسيلة ممكنةة وذلك باستخداة أي نوع من 
التقنيات المتاحة أو أي نوع من أطر التمثيلء يتم التفكير بعناية في إستراتيجيات تكوين 
البيانات وإعادة توظيفهاء مع اتخاذ قرارات إستراتيجية من شأنها أن تؤدي إلى أنواع معينة 
من البيانات. وعلى نحو مشابه. يتم توجيه كيفيه معالجه وإدارة وتحليل هذه البيانات 
من خلال الافتراضات المتعلقة بماهية الأساليب التي ربمما توفر رؤى هادفة. فالبيانات لا 
مكن إخضاعها لأى صياغة وجودية ممكنة: ولا مكن إخضاعها كذلك لأى نوع من أساليب 
cas‏ عن الناناة: غل امل أنها وها قفش حض الطفائق اللشفية ود من ذلا 
يتم اتخاذ القرارات المبنية على النظرية بشآن الطريقة الأمثل للتعامل مع مجموعة البيانات 
حتى يمكنها أن تكشف العلومات التي ربما تحمل فائدة محتملة وتكون جديرة ببحوث 
إضافية. وبدلا من اختبار صحة أي علاقة يتم كشفهاء فإن الاهتمام يتركز على تلك العلاقات 
-بناءً على بعض المعايير - التي يبدو أنها تؤدي إلى المسار الصحيح أو من المحتمل بشكل 
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اكير أن تؤدي إلى ال مسار الصحيح. وف الواقع: فإن الكثير من العلاقات المفترضة داخل 
مجموعات البيانات يمكن تنحيتها على أنها تافهة أو سخيفة من قبل متخصصي ال مجالء في 
حين يتم وسم البعض الآخر على أنها تستحق اهتماما إضافيا )2010 (H.. Miller‏ 

إن مثل عملية اتخاذ القرار هذه فيما يتعلق بطرق توليد البيانات والتحليل تعتمد على 
التفكير الاستدلالي. والاستدلال هو وسيلة للاستنتاج والتفكير ا منطقي تم وضعه بواسطة 
(C.S. Peirce )1839 - 1914( )28.[. Miller 2010‏ وبهدف الاستدلال الى خاتمه تکون 
ذات معنی منطقی ومعقول» ولکنها ليست حاسمه ق ادعاءاتها. فعلی سبیل اممثالء لا 
توجد أي محاولة لاستنتاج ما هي أفضل طريقة لتوليد البيانات» ولكن يمكن بدلا من ذلك 
تحديد طريقة ذات معنى منطقي بالنظر إلى ما هو معروف بالفعل عن إنتاج مثل هذه 
البيانات. ويستخدم الاستدلال بشكل شائع في العلوم وخاصة في تشكيل الافتراضات» على 
الرغم من أن مثل هذا الاستخدام غير معترف به على نطاق واسع. ولذاء فإن أي علاقات 
يتم كشفها داخل البيانات لا تنشأ من لا شيء: ولا تتحدث عن نفسها ببساطة كذلك. إن 
عملية الاستقراء - للرؤى الناشئة من البيانات - تتم صياغتها بشكل سياقي. وهذه الرؤى 
ليست نهانة مطاف الاستقصاء. إِذ يكم كز فا وتفسيرها من خلال نظرية G‏ وندلا من 
ذلك؛ فإن الرؤى توفر الأساس لتشكيل الافتراضات والاختبار الاستنتاجي لصحتها. وبعبارة 
أخرى» يعد العلم المقاد بالبيانات نسخة معاد تشكيلها من الطريقة العلمية التقليدية: مما 
يوفر وسيلة جديدة لبناء نظريةء وإضافة إلى ذلكء فإن التغيير المعرفي هو هادف بحد ذاته. 


ويدعي البعض أن العلم المقاد بالبيانات سوف يصبح النموذج الجديد للطريقة العلمية 
في عصر البيانات الكبيرة والمتدرجة لأن التفضيل ا معرفي يتناسب مع استخلاص رؤى إضافية 
وقيمة سيفشل العلم التقليدى امقاد بامعرفة في توليدها Kelling et al. 2009; H.J)‏ 
0 1,0111065 :2012 :811111). إن العلم المقاد با معرفة. عند استخدامه لمنهج استنتاجي 
مباشرء له فائدة معينة في فهم وتفسير العالم تحت ظروف البيانات النادرة والحوسبة 
الضعيفة: ولكن الاستمرار في استخدام مثل هذا النهج لا يبدو أنه مفهوم بشكل كلىي 
عندما تشير التطورات التقنية وا منهجية إلى أنه من الممكن الاضطلاع بتحليلات أكثر ثراء 
للبيانات - تطبيق تحليلات جديدة للبيانات وتوفر القدرة على ربط بيانات كبيرة ومتفاوته 
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وهنا بطرق كانت غير ممكنة لوقت قريبء والتى تقدم بيانات جديدة قيمة - والتحديد 
والتعامل مع الأسئلة بطرق جديدة ومؤثرة. فالعلم المقاذ بالبيانات. بحسب ما يتم نقاشه. 
يتناسب أكثر مع استكشاف واستخلاص القيمة وفهم مجموعات البيانات الهائلة والمترابطة, 
وتعزيز البحوث متعددة الاختصاصات التي تدمج خبرات ال مجال من خلال الإطار النظري 
الاستهلالي كونها أقل محدودية. وسوف تؤدي إلى نماذج ونظريات أكثر شمولية وعمومية 
للأنظمة المعقدة بالكامل بدلا من عناصر منها (2009 (Kelling et al.‏ 

فعلى سبيل المثالء يدعي البعض أن العلم ال مقاد بالبيانات سوف يحول فهمنا عن 
الأنظمة البيئية )2009 SK] pui gwg (Bryant et al. 2008; Lehning et al.‏ 
التكامل بين بيانات آنية ولحظية وعالية الدقة وذلك في سبيل تقديم نماذج تفصيلية للبيئة 
المتغيرة على النحو الذي يتعارض مع نقاط ثابتة غير متغيرة عبر المكان والزمان. ويقصد 
هنا التكامل بين البيانات التى يتم توليدها من العديد من ا لمصادر كمحطات الطقس 
التقليدية والمتحركة: والأقماز الصناعية والتصوير الجويء ورادارات الطقس» ومحطات رصد 
التيار» ومحطات القياس» وملاحظات امواطنينء: والاستشعار الحوي واختبار جودة المياه 
ومقاييس الغازء وفحص التربة. والحساسات اموزعة التي تقيس الظواهر المختارة مثل 
درجة الحرارة والرطوبة. ومن شأن ذلك التكامل أن يسهم في تحديد العلاقات الخاصة 
بين الظواهر والعمليات التي تولد افتراضات ونظريات جديدة ممكن اختبارها بعد ذلك 
من أجل التحقق من صحتها. وهذا سوف يساعد أيضا على تحديد وفهم ثقاط الربط 
بين مجالات بيئية مختلفة مثل الغلاف الجوي (الجو)ء والغلاف الحيوي (الأنظمة البيئية)» 
والغلاف امائي (أنظمة المياه). والقشرة الأرضية (القشرة الصخرية للأرض)ء والغلاف التراي 
(التربة)» والمساعدة على دمج النظريات في مجاميع نظرية أكثر شمولية. ومن شأن هذا 
أن يوفر فهما أفضل للعمليات المترابطة والمتنوعة في أرض الواقع والعلاقات الترابطية بينها 
وبين الأنظمة البشرية» ويمكن استخدامه كذلك من أجل توجيه النماذج وال محاكاة من أجل 
التنبؤ بالاتجاهات طويلة المدى والإستراتيجيات التكيفية الممكنة. 
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العلوم الاجتماعية الحاسوبية والعلوم الإنسانية الرقمية 
(Computational Social Sciences and Digital Humanities)‏ : 

في حين أن معرفية العلم المقاد بالبيانات تبدو كما لو كانت وضعت لتحويل منهج 
البحث ال مطبق في العلوم المادية» والطبيعية» والحياتية» والهندسية: إلا أن مسارها في العلوم 
الاجتماعية والإنسانية يبدو أقل تأكيدا. فهذه المجالات من العلوم متنوعة بشكل كبير في 
أسسها الفلسفية: وخاصة مع قيام عدد قليل فقط من العلماء فى هذه المجالات بتوظيف 
المعرفة المشتركة بين العلوم. فهؤلاء الذين يستخدمون الطريقة العلمية من أجل تفسير 
ونمذجة الظواهر الاجتماعيةء vele JS io‏ يستفيدون من أفكار الفلسفة الوضعية (على 
الرغم من انهم رما لا يستخدمون مثل هذا العنوان. 2006 Jiag (Kitchen‏ هذا العمل 
هيل إلى التركيز على المعلومات الواقعية والكمية - الظواهر المشاهدة تجريبيا والتي يمكن 
قياسها بشكل فعال كالأعداد وا مسافات والتكلفة والوقت على النحو الذي يتعارض مع 
المجالات الأكثر مادية من الخياة الإنسانية مثل المعتقدات والأيدولوجيات - باستخدام 
الاختبار الإحصاني من أجل تأسيس علاقات سببية وبناء النظريات والنماذج التنبئية 
وامحاكات. فاطناهج الوضعية مؤسسة بشكل جيد ف الاقتصادياتء والعلوم السياسية؛ 
والجغرافيا البشرية» وعلم الاجتماع: ولكنها نادرة بشكل كبير في العلوم الإنسانية. وعلى 
الرغم من ذلكء فداخل هذه التخصصات المذكورة» كانت هناك حركة قوية خلال النصف 
الأخير من القرن الماضي تجاه المناهج ما بعد الوضعية» وخاصة في الجغرافيا البشرية وعلم 
الاجتماع. 

وفيما يتعلق بعلماء الوضعية في العلوم الاجتماعيةء فإن البنى التحتية للبيانات» والبيانات 
امفتوحة واسيانات الكييرة توفر TT‏ هائلة من أجل تطوير نماذج أ تطورا وأكثر دقة å‏ وعلى 
نطاق واسع للحياة الإنسانية. فثورة البيانات توفر إمكانية الانتقال من دراسات ال مجتمعات 
التي تتسم بالندرة ق البيانات إلى الدراسات التريه ق البيانات» ومن اللقطات الثابتة إلى 
الانتشار الديناميي: »ومن | التجميعات الرديئة إلى الدقة العاليةء ومن النماذج البسيطة Gad‏ 
إلى محاكاة أكثر Ia aisi‏ وتطورا (2013 .)Kitchen‏ إن هناك احتمالیة لعصر جديد من 
العلوم الاجتماعية الحاسوبية التي تجري دراسات ذات اتساع» وعمق» ومدىء وإطار زمني 
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أكبر بكثير. وهي تغطي فترات زمنية متعددة بشكل متأصل» وذلك على النقيض من بحوث 
العلوم الاجتماعية الحالية (2012 (Lazer et al. 2009; Batty et al.‏ وعلاوة على ذلك 
فإن حجم» وصحة» 939 £« وشمولية. ودقة» وارتباطية» ومرونة» وتوسعية البيانات» بالإضافة 
إلى القوة اممتزايدة للحوسبة وتحليلات البيانات الجديدةء تتعامل مع بعض انتقادات علماء 
الوضعية حتى اليوم» وخاصة تلك اممتعلقة بالاختزالية والشموليةء وذلك من خلال تقديم 
تحليلات أكثر دقة وحساسية والتي مكنها أن تهتم بالسياق والاحتماليةء وهكن استخدامها 
من أجل صقل وتوسيع الفهم النظري للعالم الاجتماعي ال مكاني. وعلاوة على US‏ وبالنظر 
إلى شموليه البيانات» فمن الممكن اختبار صحة مثل هذه النظرية عبر العديد من المواقف 
والبينات. وف مثل هذه الظروف» فإن المعرفة عن الأفراد. والمجتمعات. والجماعات: 
والبيئنات سوف تصبح la asl‏ ونفعا وذلك فيما يتعلق dtl‏ السياسه والتعامل مع 
القضايا المتعدذة التي تواجه البشرية. إن التحدي الكامن في مثل هذا السيناريو مم يعد هو 
البيانات» ولكن تأسيس ظرق إحصائية ونمذجة جديدة لها المقدرة على التعامل مع ملايين 
أو oo‏ المشاهدات (2012 .21 (Batty et‏ 
وبالنسبة لعلماء ما بعد الوضعية, فإن ثورة البيانات المنتشرة توفر كلا من الفرص 
والتحديات. فالفرص تتمثل في رقمنة وربط البيانات التناظرية وغير المنظمة:» والتي يعد 
الكثير منها جديداً كوسائل التواصل الاجتماعي والكثير منها كان من الصعب الوصول 
إليها فى السابق كملايين الكتب» واطمستندات» والصحف» والصورء والأعمال الفنيةء والأشياء 
المادية... إلخ من عبر التاريخ والتى تم تحويلها إلى الصيغة الرقمية خلال العقدين السابقين 
من خلال مجموعة من (Cohen 2008) (CUAL‏ وإتاحة ادوات جديدة معالحة وادارة 
وتحليل البيانات؛ وتوفر وسائل جديدة لتعزيز التعاون بين مختلف التخصصات وتجاوز 
نموذج العام الواحد؛ وتوسعة الروابط البحثية مع المؤسسات غير الأكادممية وتضمين جمهور 
جديد على نطاق أوسع (2008 517010). وتخضع هذه الفرص للدراسة على نطاق واسع 
من خلال امجال الناشئ للإنسانيات الرقمية. والذي يجمع العلماء سويا من جميع العلوم 
الإنسانية كالمؤرخينء واللغويينء والفنانين المبدعين: وعلماء الأدب والإعلام... إلخ مع dla‏ 
ال مكتبات: وعلماء الحاسبء والسانات» وال معلومات. 
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وبشكل مبدييء فإن العلوم الإنسانيه الرقميه تتشكل من معالجة وتحليل البيانات 
التي تكونت في الأصل بشكل رقميء ورقمنة وأرشفة المشروعات التى تسعى إلى تحويل 
النصوص وال مواد التناظرية إلى صيغ رقمية بحيث ممكن تنظيمها والبحث فيها وإخضاعها 
لأشكال أساسية من التحليلات الآلية»: والموجهة. والشاملة. مثل العروض المرثية الموجزة 
للمحتوى أو الروابط بين ايلستندات» والناس أو (Schnapp and Presner 2009) SLY!‏ 
ونتيجة لذلكء فلقد ادعى المؤيدون أن المجال قد تطور لي يوفر أدوات أكثر تطورا 
معالجة. وبحث. وربط. ومشاركة. وتحليل البيانات التي تسعى إلى إتمام ودعم طرق 
العلوم الإنسانية الحاليةء وتسهيل الأشكال التقليدية من التفسير وبناء النظريةء وذلك بدلا 
من استبدال الطرق التقليدية أو تقديم منهج وضعي أو تجريبي لعلماء العلوم الإنسانية 
(Berry 2011; Manovich 2011)‏ 

إن ما توفره العلوم الإنسانية الرقمية هو وسيلة لمعالجة ومشاركة البيانات. 53b 5s‏ 
التحليل التقليدي» وتعزيز البحوث عبر مدى وحجم أكبر بكثير من المصادر, وتوفير الوقت 
والجهد. وبدلا من التركيز على حفنة من روايات العصر الفيكتوري أو صور من أوائل القرن 
العشرين أو اثنين من فناني عصر النهضة وأعمالهم: يصبح من ا ممكن البحث والربط عبر 
عدد كبير للغاية من الأعمال Alal SIS‏ وبدلا من التركيز على حفنة من المواقع الشبكية 
أو غرف الدردشة أو الصور أو الفيديوهات أو الصحف الإلكترونية» يصبح من ال ممكن دراسة 
الآلاف من مثل هذه الوسائط. ومن ثم فلقد ادعى (2011) 11320131 أن: "الدراسة 
اللعززة بالحاسب للجموعات انات ثقافية هائلة عادةٌ ما تكشف أنماطا جديدة للبنانات 
التي لا هكن حتى من خلال القراءة اممتأنية لأفضل دليل أن تكشفها". وبالطبع» فإن جيشا 
من علماء العلوم الإنسانية لن يكون قادرا بشكل حريص على القراءة المتأنية لمجموعات 
بيانات هائلة ف امقام الأول. وادعى )2005( GÍ Moretti‏ العلوم الإنسانية الرقمية ستطبق 
الصرامة ال منهجية على التخصصات التي كانت في السابق غير نظامية وعشوائية في تركيزها 
ومنهجها المتبع. وادعى أن الأدبيات ذات الصلة بالأعداد. والأشكالء والوسائط ال مرئية من 
المحتمل أن توفر رؤى جديدة وتضفي رونقا جديدا على المجالات اممنهكة. 
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وفى الوقت ذاته. وكما أن هناك فرصًاء هناك أيضا مجموعة من التحديات. فبالنسبة 
للمعارضين: فإن استخدام طرق العلوم الإنسانية الرقمية الجديدة سوف تعزز ما أطلق 
عليه (2005) 1101661 مصطلح "القراءة عن بعد" حيث ممكن لأجهزة الحاسب أن تعمل 
مثل الات القراءة (2010 Jiad (Ramsay‏ هذا النهج يتعارض مع الممارسة الراسخة منذ 
أمد بعيد والمتعلقة بتوفير قراءة متأنية للمصدر. 389 !4&3( )20 :2010( .Je Culler‏ 
سبيل المثال بأن: "ما يتعارض مع القراءة المتأنية ليس القراءة عن بُعد ولكن شيئا ما مثل 
القراءة غير المتقنة أو القراءة العرضية". واستمر قائلا بأن القراءة المتأنية تتضمن الاهتمام 
بكيفية إنتاج أو نقل المعنىء وبنوع الإستراتيجيات والأساليب الأدبية والبلاغية المستخدمة 
من أجل تحقيق ما يمكن للقارئ أن يأخذ به على أنه المؤثر على العمل أو الفقرة (ص 
22( وهذا شيء لمكن للقراءة عن بعد أن تقوم به. فقلق Culler‏ ناتج عن أن العلوم 
الإنسانية الرقمية لا تسهل أو تعزز "القراءة عن بعد" فحسب» بل إنها تجعل "من الممكن 
إجراء البحوث الأدبية بدون القراءة على الإطلاق: مشل إيجاد كافة الحالات التي وردت فيها 
كلمتي gasa" U‏ ف رُوَايات كتبها اثنان من المؤلفين ثم كتانةالتتاتج":(ص 24). 

:ob Trumpener (2009: 164) à, $5 «bL ias s29 es‏ 'النموذج المقاد إاحصاشا 
لتاريخ الأدب... يبدو أنه يتطلب يدا مجهولة غير مرئية. وعلاوة على ذلك: فإنه يحدد 
الأماط ولكنه يتجنب تحديد السببية؛ والتي لا مكن تحديدها من خلال تتبع محفوظات 
الناشرين» وقراءة مسودات المخطوطات الفردية في مكتبات الكتب النادرة ومحاولة فهمء 
من كتاب لكتاب» من قام بتحديد عنوان كل رواية: المؤلفء الناشرء أو وكيل الدعاية" (ص 
4). وبالنسبه لهاء فإن مثل هذا البحث يتضمن حركة حقيقية وليس استخدام مجموعة 
من الخوارزميات. كما أكدت أن تحليل آلاف النصوص يعني "أن أي نص معين سوف يصبح 
غير ذي صلة من الناحية الإحصائية" (ص 164). واستمرت قائلة " أي محاولة لرؤية الصورة 
بالكامل تحتاج إلى دعم من قبل ا معرفة الواسعة وفهم تأريخي فطن بكيفية عمل الأساليب 
والمؤسسات الأدبية والأدوات التفسيرية القاطعة. وف معرض تقديرها للجزافية ". اختتمت 
كلامها (ص )١7١ - ١7١‏ قائلة إنه من "المهم أن معظمنا تخلى عن الاستمرار ف البقاء ف 
المكتة... فالياس من عدم توافر المعرفة الشاملة يجب ألا يدفعنا إلى التفكير المتطرف 
ا معاكس بأنه يجب علينا أن نبدأ في معالجة الأدبيات بكميات هائلة لكي نحرز أي تقدم". 
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وبال مثل» فبالنسبة ل (2012) ©«1ع811,: فإن الآثار الثقافية مثل الأدبيات لا مكن معاملتها 
كونها مجرد بيانات. فالجزئية الأدبية المكتوبة لا يمكن أن تكون ببساطة مجرد ترتيب 
للحروف والكلمات. بل هي مقترنة بالسياق وتنقل ال معنى ولها سمات تفوق الوصف. 
فالخوارزميات ضعيفة للغاية فيما يتعلق بالتقاط وفك تشفير المعنى أو السياقء وكما 
ادعى 8131216 فإن الخوازميات تعامل جميع WINS‏ كما لو كانت هي نفسها. واستمر 
قائلا: "إن التحليل الخوارزمي للروايات والمقالات في الجرائد يكون بالضرورة ضمن حدود 
الاختزالية. إن عملية تحويل الأدب إلى بيانات تزيل التفوق ذاته. وهي تزيل التذوق وتزيل 
جميع الدقة من النقدء وتزيل التاريخ المرتبط بإطلاق هذا العملء فرواية "إلى المنارة" ما 
هي إلى رواية أخرى من ضمن ركام الروايات" 

وعلاوة على ذلك فبالنسبة للآخرين» فبدلا من العمل على المضادر الأصلية: فإن العلوم 
الإنسانية الرقمية تتعامل مع الأشياء الرقمية» التي تنقل ذفعة واحدة وتختلف من الناحية 
الكيفية عن أصولها (بمعنى أنها وصف للوصف) وذلك من شأنه أن يؤثر بشكل حتمي على 
تفس 

وبالنسبة للكثيرينء فإن العلوم الإنسانية الرقمية» في هذه الحالة» تعزز التحليلات 
السطحية الضعيفة بدلا من الزؤى العميقة المتخلخلة: ولذاء يتم.نقدها على اختزاليتها 
المفرطة وعدم إتقان أساليبهاء وتضحيتها بالتعقيد: والتدقيق: والسياقء والعمق: ونقدها 
للأماط الوصفية: والآلية» وا مدرجة؛ والمتسعة. والانطباع بأن التفسير لا يتطلب معرفة 
سياقية عميقة. ومن ثم فلقد ادعى (2013) 1201475 أن: "قيمة الفنون وجودة المسرحية 
أو الرسم لا يمكن قياسها على الإطلاق. فأنت بمقدورك وضع جميع أنواع البيانات في آلة: 
التواريخ» والألوانء والصورء وإيصالات شباك التذاكر» ولكن لا يمكن لأي منهم آن يفسر ما 
هو العمل الفنى» وما الذي يعنيه. وما السبب في قوته: فالإجابة عن هذه الأسئلة تتطلب 
إنسانا وليس آلة. وفي حين أنني متأكد أن البيانات الكبيرة مفيدة: إلا أنها لا تنطبق على 
جميع مجالات الحياة البشرية» فهى لن تحسن الظروف البشرية. فالحب» والثقافةء والفنء 
والسياسة أمور ضرورية في حياتنا ولكن البيانات الكبيرة تخبرنا القليل عن هذه الأمور. 
وباختصارء لا تصدق جميع الدعايات عن البيانات» فهي ليست الإجابة عن الأسئلة الكبيرة". 
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وعلاوة على ذلكء فإن التمويل المحدود المخصص للعلوم الإنسانية تتم إعادة تركيزه 
على مشروعات العلوم الإنسانية الرقمية وذلك على حساب الدراسات الأكثر تقليدية مما 
يحرم بعض تخصصات العلم من التمويل. وتسري تأثيرات عمليات إعادة توزيع التمويل 
أيضًا ذاخل العلوة الإنسانية الرقمية ذاتهاء حيث غالبا ما يتم توجيه التمويل تجاه بناء 
البنى التحتية للبيانات وإنشاء أدوات جديدة: وذلك بدلا من تمويل مشروعات تستفيد من 
المجموعات الرقمية من أجل الإجابة على الأسئلة الأكثر جوهرية. والنتيجة توجيه التمويل 
تحاه هندسه البرمجيات. وتطوير أدوات تحليلية. ومعدات» ومخترات» ومشروعات الموارد 
الآخرىء وذلك بدلا من تمويل العلوم الإنسانية بذاتها. 


ويمكن أن تنطبق ذات أنواع ال مناقشات هذه فيما يتعلق بالعلوم الاجتماعية الحاسوبية. 
فعلى سبيل المثالء في مناقشة تتعلق بتأليف التصوير في ويكيبيدياء ادعت فيرناندا فيجاس 
(33ع1716 )۴renanda B.‏ والتي تعمل في مختبر الاتصالات المرئية في Lhal of (IBM)‏ 
ا مرئي للبيانات يمكن أن "يساعد الباحثين على تحديد الأسئلة التى رما مكن استكشافها 
من الناحية الاحصائية - على سيل المثالء ما مدى تكرار حدوث التخريب» وما مدى سرعة 
ارتداد النص؟" (مقتبس Jes (Bollier 2010: 11 à‏ الرغم من ذلك» تعد مثل هذه 
الأجعلة نسيظة تيج ينا ففي هذه الحالهء ربما يكشف التخطيط Gabl‏ أن موضوعا ما تتم 
مناقشته بحماسة بالغة وا مدى الذي يمكن أن يجعل محرري ويكبيديا يتدخلون في عملية 
تحر ير مدخلات البيانات. ولكن التخطيط المرثئي يفعل القليل للإجابة على الأسثلة الأكثر 
نفعا وتقنويقا وكققا مثل أسباب وطبيعة النزاعات والقصص البديلة التي يتم إنتاجها. 
ولا تتم دراسة أي منها بشكل أمثل من خلال الاحصائيات. es‏ نحو مشابه: فإن خريطة 
لغة التغريدات à‏ مدينة ما رما تكشف آنماط التركيز الجغراق لجماعات عرقية متعددةء 
ولكن الأسئلة المهمة هي من JS o‏ مثل هذه التركيزات» وما السبب قي وجودهاء وما هي 
العمليات التي أسهمت في التشكيل والتكاثرء وما هي نتائجها الاجتماعية والاقتصادية. إن 
تحديد الأنماط شيء؛ ؛ ولكن تفسير هذه الأنماط شيء مختلف تماماء d b odho ¿uo‏ 
اجتماعية ومعرفة سياقية عميقة. وق مثل هذه الحالات. فإن الخطر يكمن ف Sgal ol‏ 
تمارس ببساطة بسبب توافر البيانات» مما يحد بشكل كبير من الأسئلة التي يمكن توجيهها 
وذلك لأن البيانات م يتم إنتاجها مع وجود مثل هذه الأسئلة على lSs .(Vis 2013) JUI‏ 


ثورة البيانات البيانات الكبيرة والبيانات المفتوحة:» والبنى التحتية للبيانات» والنتائج المترتبة عنها Yey‏ 


AA 


المكتبة الاقتصادية 
قناة المكتبة على ECONUBRARY phasi‏ @ 


الفصل الثامن 


ادعى )2013( 5I :Gonzalez Bailom‏ تخطيیط التوزیع QA‏ للمشاعر الإيجابيةء أو 
التكرار الذي يتم من خلاله ذكر بعض الكلمات في التواصل على الإنترنت لا يخبرنا الكثير عن 
توافق هذه الأماط مع الديناميكيات الاجتماعية التى تشكلها وتخلقها... إن قياس الأشياء 
بسبب أنه ممكن قياسها فحسب» لا يجعلها مشوقة أو ذات صلة". 

وف حالات مثل خريطة التغريدات» فإن الأماط المكتشفة نادرا ما يتعين أن تكون نقطة 
النهاية وهو ما يبدو عليه الحال في بعض المشروعات (2013 1208655). والأحرى أن تمثل 
الأماط المكتشفة نقطة البداية مما بتطلب بالتأكيد أشكالا أخرى من التحليلات ورما بعض 
مجموعات السانات الأخرى. 


وكما هو الحال مع الانتقادات الأولى للعلوم الاجتماعية الوضعية الكمية. فإن العلوم 
الاجتماعية الحاسوبية يُزج بها في مهام من قبل ما بعد الوضعيين كونها آلية» ومفتتة 
ومحددة. وتقلص الأفراد المتنوعينء والبنى الاجتماعية المعقدة متعددة الأبعاد. إلى مجرد 
نقاط بيانات Wyly)‏ منشور في الصحافة). وغعلاوة على CUS‏ فإن التحليل يفسد من 
قبل افتراضات الحتمية الاجتماعية كما أوضح (2012) 261334 ذلك بالأمثلة قائلا: "إن 
نوعية الشخص الذي تكون عليه تتحدد بشكل كبير من قبل بيئتك الاجتماعية» ولذا إذا 
كان بإمكاني رؤية بعض سلوكياتك» فيمكنني أن أستنتج الباقي. وذلك فحسب من خلال 
مقارنتك مع الأشخاص في جماعتك". وعلى النقيض من ذلك» يدعى البعض أن ال مجتمعات 
البشرية معقدة للغاية وفوضوية وغير متوقعة لكي يتم تحويلها إلى صيغ وقوانين.» حيث 
توفر النماذج الكمية رؤى قليلة لتفسير الظواهر مثل الحروب. والإبادة الجماعية. والعنف 
الأسري. والعنصرية. وعلى الرغم من أن البيانات الكمية يمكنها أن توضح بعض هذه 
المجالات. فإنها توفر رؤى شاملة فحسب للأنظمة البشرية الأخرى مثل الاقتصاد. وهي 
تفسر بشكل غير كاف دور السياسة. والأيبدلوجياء والبنى الاجتماعية:» والثقافة Harvey)‏ 
22) أن الناس az: Y‏ 39-3 بطرق TT 634529 d. Alas‏ ولكن بدلا من ذلك فهم 
يعيشون حياة مليئة بالتناقضات. والمفارقات. والحوادث غير المتوقعة. فالكيفيه التي يتم 
من خلالها تنظيم وعمل المجتمعات تختلف عبر الزمان والمكانء ولا يوجد شكل مثالي أو 
أفضل أو سمات .A lle‏ $5( الواقع. يوجد تنوع مدهش فى الأفراد. والثقافات. tud ug‏ 
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الحياة على الكوكب. فتقليص مثل هذا التعقيد إلى الموضوعات المجردة التي تشغل النماذج 
العالمية يؤدي إلى الكثير من العنف الرمزي فيما يتعلق بخلقنا للمعرفة. وعلاوة على ذلك 
فإن الطناهج الوضعية تتجاهل عن عمد المجالات الميتافزيقية (ما وراء الطبيعة) للحياة 
البشرية (المتعلقة با معانيء والمعتقدات. والخبرات) والأسئلة المعيارية (ا معضلات الأخلاقية 
والمعنوية بشأن كيف تكون الأشياء على النحو الذي يجب أن تكون عليه مقارنة بالوضع 
dbl‏ لهذه الأشساء) )2006 .(Kitchen‏ وبعبارة اخرىء» فإن المطناهج الوضعية تركز فقط 
على أنواع معينة من الأسئلة: والتي تسعى إلى الإجابة عنها بطريقة اختزالية تتجاهل على 
ما يبدو ما الذي يعنيه أن يكون المرء إنسانا وأن يعيش في مجتمعات وأماكن خصبة التنوع 
وهذا لا يعني أن المناهج الكمية غير مفيدة بل هي مفيدة بشكل واضح للغاية. وخاصة 
فيما يتعلق بتفسير ونمذجة الأنظمة الآلية ولكن ينبغي فهم جوانب قصورها فيما يتعلق 
بفهم الحياة البشرية ودمجها مع المناهج الأخرى. 

ومن ثم فلقد ادعى (20135) 810015 أن تحليلات البيانات الضخمة تتصارع مع 
الطبيعة الاجتماعية كون الناس غير منطقيين ولا يتصرفون بشكل متوقع وكون الأنظمة 
البشرية معقدة بشكل غير معقول ولديها علاقات متناقضة ومتباينة. وهي تتصارع 
كذلك مع السياق كون البيانات منفصلة بشكل كبير عن السياق الاجتماعيء والاقتصادي» 
والسياسيء والتاريخي. وهي أيضًا تخلق أكواما هائلة من القش كونها تتكون من ارتباطات 
غير طبيعية هائلة للغاية مما يجعل من الصعوبة بمكان تحديد مكان الإبرة أو ما نبحث عنه 
وكونها تواجه مشاكل عند مجابهة المشاكل الكبيرة وخاصة المشاكل الاقتصادية والاجتماعية. 
وهي كذلك تفضل المستنسخ على الأصل كونها تحدد الاتجاهات ولكنها لا تحدد بالضرورة 
السمات اطهمة التي ربما تتحول إلى اتجاه وكونها تحجب القيم وامصالح المتعلقة بمنتجي 
البيانات وهؤلاء الذي يحللون البيانات واهدافهم. 

وهم يفعلون ذلك لأنه وكما قال )174 :1981( Peter Could‏ وهو مؤيد للمناهج 
الإحصائية في تحليل البيانات: "يبدو أن رموز لغاتنا الرياضية مقيدة ومحددة بشكل كبير. 
وقي الغالب هم يحدثون أضرارا ليس لأنهم يقيدوننا فحسب» ولكنهم ف الواقع محون من 
الوجود ما يمكن أن يكون مستحقا لانتباهنا واهتمامنا. وإذا ما تصورناء وهذا ما نفعله في 
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الغالب» الطبيعة متعددة الأبعاد التى تصف تعقيد حياتنا ا معاصرة... والفراغات الناتجة 
بواسطة الفلتر الخطي Called)‏ 5]131261) امسمى (Factor Analysis) Jell Llas‏ 
فرمما نقوم بسحق ا لمعلومات خارج الوجود وذلك تحت مسمی التبسيط. إنني لست 
متأكدا اما من السبب وراء فعل ذلكء عدا أن لدي شعورا مؤكدا تقرنبا أن توافر أجهزة 
حاسوب كبيرة وسريعة. وكذلك البرامج الجاهزة له يد في ذلك . 


وبالنسبة ل 60114. فإن فهم السلوك البشري وال مجتمعات البشرية لا يمكن ولا يجب 
تحويله إلى تحليلات متكررة ومنهجية وآلية: ولقد دعا إلى التفكير المستدام بشأن أنواع 
الأساليب التي يتعين استخدامها مع أي نوع من البيانات. وتحت أي ظروفء وذلك من 
أجل الإجابة عن بعض الأسئلة المحددة. بدلا من تشغيل البيانات من خلال مصنع "نقانق" 
CUl Ganl‏ ينتج لحوما منخفضة الجودة من الألف إلى اليناء بدلا من تقطيع اللحوم 
اطنتقاة. 

وفيما يتجاوز الأسلوب المنهجي وا معرفي. فإن جزءا من القضية هو أنه يبدو أن بعض 
D‏ البيانات الكبيرة تحدث 095 38279 آي أسئلة على JUI‏ أو أن يكون التركيز 
PETN‏ من قبل تطبيق طريقة أو محتوى بلجموعة السبانات بدلا JI Lus (ya‏ خد 9l‏ ال 
تكون مجموعة البيانات مستخدمة من أجل البحث عن إجابات عن أسئلة لم يتم تضميمها 
لكي يتم الإجابة عنها في المقام الآول. وفيما يتعلق بالأخيرء لم يتم إنتاج بيانات تويتر ذات 
لاان امد :جخ افا من أجل تقديم إجابات تتعلق بالتركيز الجغرافي لمجموعات اللغة في 
مدينة ما والعمليات التى تقود مثل هذا الارتباط الآلي المكاني. فنحن يجب علينا ألا نشعر 
بالدهشة رها ف حالة ما إذا كانت النتيجة لقطات سطحية فحسبء حتى وإن كانت لقطة 
dixil;‏ بدلا من ذلك فإن ما يجب أن يدهشنا هو الرؤى المتعمقة والمتغلغلة في جغرافيات 
الجنس» واللغةء والتكتلات» والانعزال ف آماكن معينةء ولهذه الأسباب. ستظل دراسات 
البيانات الصغيرة مفيدة. 

وقي معرض الدفاع عن المنهج المستخدم من قبل العلوم الإنسانية الرقمية» ادعى 
)2011( 1130116 أن الهدف ليس استبدال الخراء البشر بين بأجهزة الحاسب» ولكن 
الهدف هو استخدام التحليلات من أجل استكشاف مجموعات البيانات الهائلة مثل بلايين 
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التغريدات» أو ملايين الفيديوهات على موقع يوتيوب» أو عشرات الالاف من الروايات ومن 
تم اختيار أهداف duss dli‏ من أجل التحليل اليدوى المحكم. وبعبارة أخرىء قان 
منهج العلوم الإنسانية الرقمية يفتح أمامنا إمكانية إجراء الدراسات السطحية على نطاق 
واسع Jus uel a se‏ من الدراسات المتعمقة التى تركز على أعداد قليلة من الأفراد 
.)Manovixh 2011(‏ وباممشل» يدعي البعض أن هذ المنهج يوفر العمل الدؤوب للتعمق 
في آلاف صفحات الأخبار ومشاهدة مئات الساعات من البرمجة. لكي "يتمكن الباحثين 
من تركيز طاقاتهم بشكل فعلى على التفسير" (2012 1131115).: ولذاء اقترح Flaounas et‏ 
ol (al. (2013: 111‏ " أتمتة الكثير من المهام في تحليل ال محتوى الإخباري لن يحل محل 
الحكم البشري المطلوب من أجل أشكال التحليل النوعية والدقيقةء ولكنه سوف يسمح 
للباحثين بتركيز اهتمامهم على مدى أبعد بكثير من أحجام عينة الأشكال التقليدية من 
تحليل المختوق: وبدلا من قضاء الكثير من العمل الثمين على مرحلة ترميز البيانات الخام» 
يمكن للمحليين التركيز على تصميم التجارب والمقارنات من أجل اختبار فرضياتهم: وأن 
يتركوا لأجهزة الحاسب مهمة اكتشاف جميع المقالات في موضوع معينء وقياس العديد من 
سمات ال محتوى مثل قابليتهم للقراءة» واستخدام أشكال معينة من اللغة والمصادرء إلخ. 
مجرد عدد قليل من اللهام التي يمكن أتمتتها في الوقت الراهن". 
وبا مثلء فلقد ادعى )2012( 9l Selisker‏ العلوم الإنسانية الرقميه لا تسعى or Jl‏ 
تستبدل الأدب برموز الحاسيء أو أن تقايض التعقيد a»‏ بصيغ لا هدف لها. ودلا من 
«AUS‏ فإن هذه ال مشروعات تفكر فحسب بطرق إبداعية عن المشاكل التاريخة الآدسة التى لا 
مكن التعامل معها بسهولة بدون الحواسيبب". وبالنسبة ل (2010 :2003) :18311152 مكن 
أن تساعد الحوسبة في عملية التفسيرء ولقد ادعى أن القراءة المتأنية تتضمن ممارسات اختيار 
وعزل وملاحظة الأماط فى النصوصء وأن ¿ الترميز ذو كفاءة عالية في مثل هذه الممارسات. 
وعلاوة على ذلك فإن الترميز يقوم بالأمر نفسه بطرق أكثر موضوعية واتساقا من النظرة 
الذاتية للعامء وبدلا من استبدال التعرف على (sl‏ فبالنسه له فإن توظيف الخوارزميات 
يسهل هذه العملية. 
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الفصل الثامن 


إن دفاع العلوم الاجتماعية الحاسوبية أمر مختلف تاما في الغالب» فقي حين أن جميع 
العلوم الإنسانية الرقمية تقر بقيمة القراءة المتأنية» وتؤكد أن القراءة عن بعد تكملها 
من خلال توفير التعمق والسياقية. فإن الأساليب الموضوعية للعلوم الاجتماعية تتعارض 
مع المناهج بعد الوضعية. إن الفرق بين العلوم الاجتماعية الحاسوبية والعلوم الإنسانية 
الرقمية بهذا الصدد يرجع إلى أن الإحصائيات المستخدمة فى العلوم الإنسانية الرقمية 
وصفية بشكل كبير تحدد الأنماط وتصوغهم كأعداد وصور وخرائط. وعلى النقيض من 
ذلك فإن العلوم الاجتماعية الحاسوبية تستخدم المنهج العلمي حيث تكمل الإحصائيات 
الوصفية بالإحصائيات الاستدلالية التي تسعى إلى تحديد السببية. وبعبارة اخرىء فإنها 
تحصل على الدعم من قبل ال معرفة حيث يكون الهدف هو تقديم نماذج إحصائية متطورة 
تفسر وتحاي وتتنباً بالحياة البشرية. ومن الصعوبة بمكان التوفيق بين هذا وبين مناهج 
ما بعد الوضعية: فالدفاع في هذه الحالة يرتكز على فائدة وقيمة الطريقة والمناهج. وليس 
على توفير تحليل تكميلي لمجموعة من البيانات أكثر تمددا. 

وهناك بدائل مثل هذا الموقف. مثل البديل الذي تم تبنيه في نظم المعلومات الجغرافية 
(15©) والإحصائيات الجذرية (5]2615]165 1620121): وهؤلاء الذين يستخدمون مناهج 
ذات طرق مختلطة. وهذا يتضمن إما توظيف النماذج والإحصائيات الاستدلالية شريطة 
أن يكون هنالك إدراك لمواطن الضعف فيهماء أو: كما يحدث على نحو شائع: استخدام 
الإحصائيات الوصفيّة التق تذعمها دراسات البيانات الشغيرة. 'وهناء يتم'استخداغ كل من 
البيانات الكبيرة والبيانات الصغيرة من أجل توفير رؤى مختلفة ولكن تكميلية. وبغض 
النظر عن مثل هذه التكميليةء فإن الكثير من علماء ما بعد الوضعية سوف يستمرون في 
مقاومة البيانات الكبيرة والمناهج الإحصائية بأشكالها المتعددة: وبلا شك فإن المجادلات 
سوف تتسارع وتيرتها في ال مستقبل ال منظور. 
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إعادة صياغة بحوث العلوم: والعلوم الاجتماعية: والعلوم الإنسانية 


الخاتمة: 

هناك شكوك قليلة بأن ثورة البيانات أتاحت احتمالية إعادة التشكيل المعرف للعلوم 
والعلوم الاجتماعية والإنسانية» وأن مثل إعادة التشكيل هذه تحدث بالفعل بشكل فعال 
ونشط. فالبيانات الكبيرة وتوسع البيانات الصغيرة من خلال البنى التحتية للبيانات يساعدان 
على تنفيذ مناهج جديدة تجاه إنتاج وتحليل البيانات: مما يجعل من الممكن توجيه الأسئلة 
والإجابة عنها بطرق جديدة. وقد شجع هذا البعض على الادعاء بشكل جريء بأن ثورة 
البيانات هي ابتكار تدميري يعلن عن نقلة نوعية في كيفية إجراء البحوث. وهذه بالقطع 
هي الحالة حيث إن التحول من صحاري البيانات إلى طوفان البيانات وتحليلات البيانات 
الجديدة سيغير الممارسات البحثية. وعلى الرغم من ذلكء يتعين أخذ الحيطة عند القيام 
بتأكيدات تتعلق بإعادة تشكيل البحث وبأفضل طريق بمكن اتباعه في إعادة التشكيل oja‏ 

إن العلم يعامل بشكل سين من قبل الادعاءات القائلة بآن تورة البيانات تعني "أن 
البيانات يمكنها أن تتحدث عن نفسه" أو أنه يمكنها بدون أي مشاكل استخدام أساليب 
مثل تجريف البيانات حيث يسبق الارتباط السببية» (انظر الفصل التاسع). وتعد المناهج 
التي يتم تطويرها داخل العلوم المقادة بالبيانات والتى تمزج بين «JV‏ والاستنتاج 
والاستقراء أكثر إنتاجية بكثير. حيث تتم إعادة تشكيل الطريقة العلميةء وذلك بدلا من 
تدميرهاء إن الأسس الفلسفية للعلم الممقاد بالبيانات» على الرغم من ذلك» لا تزال ف آطوارها 
التمهيدية وهناك حاجة للتفكير المستفيض في معتقداتها المعرفية ومبادئها ومنهجيتها. 

أما الموقف فيما يتعلق بالعلوم الاجتماعية والعلوم الإنسانية فهو أكثر تعقيدا بشكل ما 
وذلك إذا وضعنا في الاعتبار تنوع m‏ الفلسفيه لهذه العلوم» حيث إنه من غير ال محتمل 
أن تقود ثورة البيانات إلى تأسيس نموذج جديد. وبدلا من ذلك فإن البنى التحتية للبيانات 
وثورة البيانات سوف يعززان مجموعة البيانات المتوافرة للتحليل ويمكنان مناهج وأساليب 
جديدة» ولكنها لن تحل محل دراسات البيانات الصغيرة. وفيما يتعلق بالعلوم: هناك 
حاجة لتفكير نقدي أوسع في الآثار المعرفية لثورة البيانات على العلوم الاجتماعية والعلوم 
الإنسانية. وهذه المهمة بدأ بالكاد التعامل معها وذلك على الرغم من سرعة التغيير الحاصل 
في مشهد البيانات. 
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الفصل التاسع 
القضايا الفنية والتنظيمية 


(Technical and Organizational Issues) 


كما ناقشنا في الفصلين السابقينء توفر البنى التحتية للبيانات ومبادرات البيانات 
المفتوحة وإنتاج البيانات الكبيرة فرصاً جديدة لقياس وفهم العالم. وهي أيضًا تثير قضايا 
فنية وتنظيمية, وتطرح أسئلة معيارية وأخلاقية. وفي هذا الفصلء سيتم التركيز على الأمر 
الأولء ما يعني التركيز على بعض القضايا مثل مجال مجموعات البيانات» والوصول إلى 
الببانات: وجودة السانات» وتكامل البيانات:ء والتبادلية (القائلية للتادل). وتظبيق التحليلات 
والمغالظ ات البيئية» والمهارات والقدرات والإمكانات التنظيمية. فبعض هذة القضايا ممكن 
التعامل معها من خلال الحلول الإدارية والفنية» في حين أن البعض الآخر من هذه القضايا 
تمثل مشاكل عسيرة الحل ومن الصعب التعامل معها. وعلى الرغم من ذلكء. فإذا كانت 
القضايا المتعلقة بجودة البيانات والمغالطات البيثية لا ممكن التعامل معها بشكل كاف. 
ففي هذه الحالة لا يهم ماهية النظريات المعرفية التي يتم تطبيقهاء (انظر الفصل الثامن). 
لآن التحليلات والتفسيرات ستكون محل ارتياب. وعلاوة على ذلك» فإذا كان الوصول إلى 
البيانات مقيدا بشكل كبيرء أو إذا كانت الحكومات والشركات والمجتمع المدني يفتقرون 
امهارات الكافية لإدراك المغزى من هذه البيانات. ففي هذه الحالة ستكون قيمة ومنافع 
البيانات المفتوحة والكبيرة المتدرجة مقيدة بشكل كبير للغاية. ونتيجة لذلكء فإن القضايا 
التي تمت مناقشتها في هذا الفصل لا يمكن تجاهلها أو إبعادها بسهولة: ومن ثم فهي 
تتطلب الاهتمام البالغ. وفي الفصل التاليء سيتحول التركيز إلى قضايا سياسية واجتماعية 
أعم وأشمل والتي تتعلق بإنشاء ومشاركة وتحليل واستخدام البيانات مع الوضع في الاعتبار 
الأبعاد الأخلاقية: والقانونية: والأمنية لثورة السانات. 
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الفصل التاسع 


الصحاري والفيضانات (1865ء10 :(Deserts and‏ 

في كافة النقاشات الدائرة بشأن ثورة البيانات يكون في الغالب من الصعب تحديد مصدر 
مجموعة مناسبة من البيانات فيما يتعلق بالكثير من الظواهرء وبخاصة تلك البيانات التى 
تغطي فترات زمنية طويلة ومتأصلة مكانيا. وبشكل جزئء فإن هذه تعد قضية من قضايا 
التغطية من ناحية» ومن قضايا الوصول من ناحية آخرىء» فمن جانب التغطيةء فإن جميع 
مصادر البيانات محددة من ناحية العينهء والمدى الجغراق» والوقت» ومتغيرات الصفات 
(الحقول) والمؤشرات. وف الواقع» فإن العام معقد بشكل كبير لغاية أنه يستحيل التقاط 
نطاق كامل وكافة فروقاته الدقيقة. وتناقضاته»› وتبايناته. 

إن البيانات التى يتم جمعها من خلال دراسات البيانات الصغيرة تعد عينات بشكل 
صريح للغاية» وهي تجمع بشكل غير مستمرء وهي ذات رقم محدد من المتغيرات وذلك 
بالنظر إلى تركيزها المحكم والتكلفة المرتبطة بالجمع والتحليل: فمعظم هذه الدراسات 
ë‏ دراسات أو تجارب منفصلة تركز على قضايا وحالات معينة لمجموعة: مؤسسة. elgi‏ 
أماكن. تقنيات... إلخ. وهي تفتقر إلى المكون الطولي حيث إنها لا تغطي فترات زمنية 
متعددة وطويلة. فالدراسات التي تقوم بدراسة التغييرات بمرور الوقت عادة ما يتم 
تكرارها على فترات محددة. وق هذه الحالة: فإن فهمنا لظاهرة معينة عادة ما يعتمد 
على مجموعة مقيدة من البيانات. وحتى عندما يتم تجميع وترقيه مجموعات البيانات 
داخل البنى التحتية للبيانات» فإن التغطية تكون جزئية وانتقائية. فعلى سبيل ال مثال: فإن 
مجموعات بيانات الإدارة العامة الأيرلندية ذات تغطية محدودة وهي مملوءة بالفجوات 
والسكنات عن قطاعات معينة مثل قطاعات الإسكان والنقلء وغالبا ما يتم الاحتفاظ بها 
داخل المؤسسات (2007 .21 (Kichin et‏ 

وعلى نحو مشابه» فإن البيانات الكبيرة ربما تميل إلى أن تكون بيانات شاملة» ولكن وكما 
هو الحال مع مجموعات البيانات الأخرىء فإن كلتيهما تكون تمثيلا وعينة.» وهی تحل» 
بشكل جزني فحسب. قضية صحراء البيانات التي يقصد بها أن تكون البيانات موزعة على 
مجاميع بيانات متفرقة يصعب استقاء البيانات منها أو إضافة بيانات اليها. وكما لاحظنا في 
الفصل الثاني» فإن البيانات التي يتم التقاطها تتشكل من قبل التقنية المستخدمة: والسياق 
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القضايا الفنية والتنظيمية 


الذي تم فيه إنشاء هذه البيانات» وتوصيف البيانات الذي تم توظيفه. فالبيانات المنشئة 
تمثل عادة ما يمكن التقاطه إلى حد ما بطريقة مباشرة وهي تكون في غالب الأحيان منتجا 
فرعيا للنظام» ويكون مجالها الفوري مقيدا من قبل النطاق كسلاسل الأسواق المركزية 
وشبكات المستشعراتء ومواقع التواصل الاجتماعي. وفيما يتعلق بالعلوم» فإن البيانات 
الكبيرة يتم إنشاؤها حاليا مما يتعلق مجموعة منتقاة من ال موضوعات his‏ وهى بعيدة 
كل البعد عن أن يتم إنتاجها عبر جميع النطاقات والبؤر العلمية. وعلاوة على ذلك فإن 
القرار فيما يتعلق بإنشاء البيانات الكبيرة لم يتشكل بعد ولكنه يتطور ويتركز من أجل توفير 
مجموعة من الرؤىء بحيث تشكل كل واحدة منها بعضاً من العناصر التى يتم التقاطها 
كالاتساع. والعمقء والتفاصيل... إلخ. وحتى عندما يتم دمج بيانات كبيرة مع مجموعات 
البيانات الأخرىء فإن مجالهم يكون بعيداً كل البعد عن كونه مجالا عالميا. ولذاء فإن 
البيانات الكبيرة» في هذه الحالة: لا تعالج مسألة صحاري البيانات وذلك فيما يتعلق بالكثير 
من مجالات الدراسة. 

وفى؛الوقت:نفسه. وفى حَين أن صحتاري البيانات فازال تواجدها مستمراء فإن البنى 
التحتىة للسانات والسانات الكبيرة أنشاًا طوفانا من البيانات في بعض المجالات. وكما لاحظنا 
في الفصل الرابع: كان هناك ف WEN‏ في حجم وسرعة إنتاج البيانات والتي تم تحديدها 
ol Jal o‏ تنمو بسرعة عالية. وذلك مع إنشاء وبدء ال مصادر الجديدة:. وتعقد مجموعات 
البيانات التى تم انتاجهاء والمقدرة على ربط السانات بعضها النعض. ومن شأن هذا الطوفان 
أن يفرض عددا من التحديات فيما يتعلق بامناوله: وامعالجة. «xelils‏ والتصنيف» والفهم 
(Gantz and Reinsel 2011) SLLJI oja E4‏ ودلا من مجموعات اسيانات الصغيرة 
وغير المستمرةء يحاول ال محللون الاستفادة من الكميات الهائلة من البيانات التي يتم تدفقها 
من أنبوب سميك. فمعظم هذه البيانات أصبحت بيانات عابرة وتم فقدهاء وم يتم أبدا 
تحليلها أو الاستفادة منها. وبعض هذه البيانات قد تم تخزينها في مستودعات البيانات 
التي تمثل إلى حد كبير مكبات غير مراقبة للنفايات (2013 (Asay‏ وهناك يتم الإبقاء عليها 
حتى تأق أوقات بمكن لهذه البيانات أن تقدم فيها معلومات مفيدة. ونتيجة لذلكء وبينما 
تزداد نسبة البيانات بشكل تصاعديء فإن نسبة البيانات التي يتم معالجتها وتحليلها تقل 
.(Zikopoulos et al 2012) y5 Jis‏ وقد أشار (2012) 1١1‏ إلى أنه في الوقت التي 
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تزداد فيه البيانات» يتم الحصول على معلومات أقل كنسبة من هذه البيانات. وبعبارة 
6,21« تزداد ضوضاء السانات بشكل كبير للغاية ولكن إشارات ال معلومات تنمو بشكل أقل 
دكثيرء وعلاوة على ذلك» يصبح الأمر أكثر صعوبة لعزل هذه البيانات في خضم هذه الضواء 
(انظر 2012 iiia (Silver‏ بلا جدال وظيفة البيانات الكبيرة وعلم البيانات حيث لا 
يزالان في أطوارهما الأوليةء ومع الاستغلال الكامل للأساليب الحديثة والتي بإمكانها مراقبة 
ومعالجة وتحليل كميات هائلة من البيانات بشكل آني أو لحظي إلا أن هذا من المتعذر 
تحقيقه بشكل كبير. وحتى مع نضوج وتطور تحليلات البيانات الكبيرة. فإنه من المرجح آن 
تعاني من أجل تطوير طرق ومناهج يمكن من خلالها استخلاص التحليلات المفصلة وليست 
التحليلات السطحية؛ والتعامل مع أسئلة "ISU"‏ وكذلك أسئلة "ماذا"؛ وتقديم إيضاحات 
وليس شروحات (انظر الفصل الثامن). وعلاوة على ذلكء يتعين تنويع هذه الطرق وذلك 
من أجل مجاراة الأشكال الجديدة من البيانات التي يتم إنشاؤها من قبل المصادر المبتكرة. 
وحتى مع تحقيق ذلكء فإن مجاراة طوفان البيانات واستخلاص إشارات ذات مغزى من 
الضوضاء سيكون كفاحا Pt‏ 


الوصول (55ع©4): 

إن العائق الأساسي الآخر أمام الاستعانة بمصادر مجموعات مناسبة للبيانات هو مدى 
قابلية الوصول إلى هذه ال مجموعات وقيود التراخيص التى تحدد معايير استخدام تلك 
المجموعات. وبشكل واضح. وكما ناقشنا في الفصلين الثاني والثالث. فإن الوصول يعتبر 
قضية أساسية فيما يتعلق بالبحوث والبيانات الممولة من قبل ا لمؤسسات العامة والتي 
تنشتها الهرئات العامة. فمحفوظات السانات والبنى التحتية للسانات ومبادرات السيانات 
المفتوحة تعني وتهتم بشكل كبير بمشاركة وإنتاج البيانات المتاحة للتحليل. وكما أوضحت 
المناقشات فى الفصول المشار إليها سابقاء فعلى الرغم من حقيقة أن البيانات غير تنافسية: 
وغبر قابلة للاستثناء أو الإاقصاء: ولها تكلفة هامشية عند استنساخها (2010 101:ه11).: إلا آن 
البيانات مقيدة بشكل gu‏ وذلك عند توزيعها. وف بعض الأحيان» فإن الوصول المقيد إلى 
السيانات يكون batsa m‏ فيهء وذلك إذا وضعنا في اعتبارنا طبيعتها الحساسية والشخصية 
وكذلك البعد الأخلاقي ا مرتبط بنشر واستخدام هذه البيانات (انظر الفصل العاشر). وق 
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أحيان أخرىء يكون الوصول إلى البيانات مقيدا لأجل التأكد من أن هؤلاء الذين يحتفظون 
بهذه البيانات سيرفعون من قيمة هذه البيانات ويضيفون ميزات تنافسية لها أو يحققون 
أموالا من خلال البيع او الترخيص للوصول لهذه البيانات (انظر الفصل السابع). وفي أحيان 
أخرىء ربما ترغب إحدى الهيئات في تقييد توزيع البيانات نتيجة أنها تخشى ما يمكن أن 
تكشفه هذه البيانات» والذي ربما يكون له تداعيات سياسية أو اقتصادية. أو يكون مرد 
ذلك الخوف من كشف تدني جودة البيانات التي كانت محفوظة. 

وف حين أن هذه المعوقات بدأت تتلاثى ببطء فيما يتعلق بالبيانات الممولة والمستحدثة 
من قبل المؤسسات العامة في الدول الديمقراطية الغربية» إلا أن مثل هذه التحركات تعد 
أكثر تقلبا مع تلك البيانات المستحدثة من قبل المؤسسات الخاصة. وفي الواقع: فإن هذا 
الأمر بعد متتاقضا إلى حد ماء إذ إنه على الرغم من طوفان البيانات الكبيرة الناشئ إلا 
أن الوضول إلى مثل هذه السانات يظل قدا مهن فنا في الوؤقت الحاليء: وذلك بوجود 
عدد محدود للغاية من الكيانات الغارقة في مثل هذا الطوفان والتي يمكنها الوصول 
إليه )2011 (Crawford 2012, King‏ فالشركات من أمثال مشغنلي الهواتف الخلوية. 
ومطوري التطبيقات. ومزودي وسائل التواصل الاجتماعيء وامؤسسات امالية» وسلاسل 
التجزئة» وشركات المراقبة والشركات الأمنية: لا يقع على كواهلها أي التزامات لمشاركة 
البيانات التي يستحدثونها من خلال عملياتهم التشغيلية بحرية. وعادة ما يتم التفاوض 
للوصول إلى البيانات بشكل فردي وهذا يتضمن توقيع العديد من اتفاقيات حماية الملكية 
الفكرية واتفاقيات عدم الإفصاح, وكذلك الموافقة على الشروط والبنود التى تحدد كيف 
وق آي غرض سيتم استخدام أو لا يتم استخدام مثل هذه البيانات. وحتى بعد كل هذاء 
فمن المحتمل أن تمثل البيانات التي يتم توفيرها عبنة محدودة: كما من الممكن أن تفتقر 
هذه البيانات إلى ال معلومات السياقية مثل الكيفية التي تم تعيين هذه البيانات من خلالهاء 
أو تكون البيانات غير معالجة بشكل كبير أي م يتم تنقيتها أو هيكلتهاء أو تكون مُجمعةء 
أو مجردة من اللمتغيرات المفيدة: أو معالجة بشكل أو بآخرء وذلك من شأنه أن يقبد 
اجات تحليل هذه البيانات. وق بعض الحالات» مكن آن يتم LaS doll‏ محدودة من 
البيانات للباحثن والجمهور وذلك من خلال واجهات برمجة التطبيقات Application)‏ 
15 - وءع112]6112 21:051:31111111115). فواحجهات برمجة التطسيقات تتكون من مجموعة 
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من الأوامر التى يمكن استخدامها من أجل استعادة البيانات المخزنة في قواعد بيانات على 
خادم متاح الوصول إليه للجمهور (2011 1ء11211071). فعلى سبيل «JUL‏ يسمح تويتر 
لعدد محدود من الشركات بالوصول إلى كافة بباناته المتدفقة عير موقعه. وذلك مقابل 
رسوم أو لأغراض تجارية. وهو يتمتع بالصلاحيات التي تسمح له بإملاء شروطه فيما 
يتعلق بالأغراض التي مكن فيها استخدام مثل هذه البيانات. فالباحثون يتم تقسيمهم 
إلى قسمين: القسم الأول يمكنه الوصول إلى *٠١‏ من التغريدات العامةء والقسم الثاني لا 
يممكنه الوصول إلا إلى XY‏ فحسب من التغريدات العامة أو يمكنهم الوصول إلى مجموعات 
فرعية مختلفة من المحتوى (الحسابات المدرجة ق القائمة البيضاء). وذلك مع استبعاد 
التغريدات الخاصة واطحمية في جميع الأحوال )2012 .(boyd and Crawford‏ 35 
حال المواقع الإلكترونية التي تحوي على سبيل امثال قوائم منتجات وتقييماتها (٤ucں ۴۲٥d‏ 
.)Business Directories) J kel olg (Listings and Reviews‏ وكذلك ق حال وسائل 
التواصل الاجتماعي والتي تتضمن الملفات الشخصية العامة (2:01165 عذاان8) والتغذية 
olè (Feeds)‏ بعض الشركات Mozenda)) 45,55 (80legs) (www.80legs.com) ,J-Xs‏ 
١-3273‏ توفر خدمات زاحف الشيكة sl)‏ تصفح الشبكة العالمية بطريقة 
منهجية وآليه ومنظمة) وتجريف الشبكة (أي استخراج البيانات من مواقع الإنترانت عن 
طريق برامج مخصصة ) لحصد بيانات مفصلة من هذه المواقع أو للوصول لبيانات تغذية 

وما يقلق في هذا الأمر هو أن المعلومات التي يمكن أن توفرها البيانات الكبيرة المملوكة 
للشركات الخاصة والتي تم بيعها بشكل تجاري سوف تكون محصورة على قطاع الأعمال 
فحسب» أو رها يتم إتاحتها طمجموعة مميزة من الباحثين الأكاديميين الذين لا يمكن تكرار 
النتائج التي توصلوا إليها أو التحقق منها )2011 2l Js .(Lazer et al. 2009; King‏ 
من هذه المواقف يخدم المصلحة العامة. ولكن إذا وضعنا في اعتبارنا القيمة التجارية 
للبيانات محل المناقشة فإن زيادة الوصول إلى هذه البيانات لن يكون مهمة سهلة أبدا. 
فحقيقة أن السانات الكبيرة الثرية من الناحيتين الاجتماعية والثقافية مملوكة للشركات 
الخاصة تشير إلى أنه في الوقت الحالي لن يكون من السهل ف الواقع إجراء بحوث العلوم 
الاجتماعية الحسابية والعلوم الإنسانية الرقمية (2011 .(Manovich‏ فكما ذكر كلا من 
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boyd and Crawford (2012: 673)‏ فإن " الكثير من الحماس الذي يحيط بالبيانات 
الكبيرة ينبع من الإدراك القائل بأن هذه البيانات توفر وصولا سهلا لكميات هائلة من 
البيانات. ولكن من يتمتع بمثل هذه القدرة للوصول إلى هذه البيانات؟ ولأي غرض يتم 
الوصول؟ وف آي سياق يجرى هذا الأمر؟ وما معوقات الوصول؟" فهذه أسئلة تتطلب 
الكثير من التفكير مع اتخاذ إجراءات مناسبة. 


:(Data Quality, Veracity and Lineage) جودة وصحة وأصل السانات‎ 

جودة وصحة البيانات هما أمران مهمان للغاية كونهما يعززان المدى الذي يمكن أن يثق 
فيه المرء بالنتائج المستخلصة من تحليل البيانات. وترتبط جودة البيانات بمدى تنظيمها 
أي خلوها من الأخطاء والفراغات» ونقائها أي خلوها من التحيزء وتماسكها معنى أن تحوى 
القليل من التناقضات. بينما يشير مصطلح صحة البيانات إلى موثوقية البيانات وإلى مدى 
تمثيلها للمعنى الذي تُشير اليه بدقة (إتقان) وأمانة (إخلاص). ولهذا فإن تأسيس وتوثيق 
جودة وصحة البيانات يعتبر شقا رئيسيا في (Lal JY‏ البيانات. فسّلالة أصل البيانات هي: 

المعلومات التى تصف مصدر الملاحظات. والمنهجيات التي خضعت لها البيانات عند 
جمعها وتصنيفهاء والتعديلات» والتحولات» والتحليلء والاشتقاقات التي تعرضت لهاء وهي 
توفر أيضا الافتراضات والمعابير التى تم تطبيقها عند آي مرحلة من مراحل حركة هذه 
السانات. وكذلك el‏ تحىزات... وتوفر Y‏ أصل البيانات مجموعةه بيانات مع أصلها 
وتسمح للمستخدم أن يحدد مدى ملاءمه البيانات للاستخدام )2012 (Lauriault‏ 

وهي أيضا تصف بالتفصيل منشأً البيانات. ومن شأن الجودة والصحة وسّلالَة الأصل 
الضعيفة للبيانات أن يقوضنّ درجة الثقة والمصداقية التى يمكن أن يضعها الشخص في 
مجموعة البيانات والتحليلات التى اعتمدت على هذه البيانات. 

ومن الناحية التقليدية: فإن الدراسات القانئمة على بيانات نادرة والتى يكون حجم 
العينات فيها صغياً في الغالب. فإن جودة وصحة وأصل البيانات تكون على قدر كبير 
من الأهمية. فإذا كان الشخص سيعمل على استخلاص نتائج عن السكان بالكامل وذلك 
اعتمادا على عينة مثالية صغيرة» فإنه يتعين في هذه الحالة أن تكون العينة واضحة للغاية 
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وخالية من العيوب بأكبر قدر ممكنء ويتعين أن تكون على درجة عالية من الدقة والصحة. 
وعلى الرغم من ذلكء فإن عدد مجموعات البيانات يتم تشكيلها بشكل تام محدود للغاية: 
ويمكن استخدامها بدون أي شكل من أشكال تنظيف البيانات» بمعنى التحقق من الأخطاء 
وتصحيحهاء وإضافة البيانات المفقودة: ومعايرة وإعادة تهيئة البيانات حتى يمكن ربطها 
مع بيانات أخرى أو لتكون هذه البيانات سهلة الاستجابة لمناهج تحليل معينة (انظر 
الفصل السادس). ولذاء فإنه يتم استهلاك الكثير من العمل خلال تصميم البحث من 
أجل تقييد التحيزات المنهجية والتحيزات المرتبطة بتحديد العينات ي يتم التأكد من أن 
اليانات دقيقة وذات مصداقية بقدر الإمكان قبل تحليل أو مشاركة هذه السانات. وتعمل 
المحفوظات الأرشيفية والبنى التحتية بشكل نشط من أجل التأكد من آن تظل مثل هذه 
البيانات ذات مصداقية ودقيقة وصحيحة بمرور الوقتء مع المحافظة على سُلالة أصل 
البيانات من خلال الاستقرار المؤسسيء وعمليات إدذارة البيانات وواصفات البيانات» وتمكين 
نقل البيانات عبر مختلف الصيغات والمنصات مما يحقق الؤامة بين الأجيال المختلفة من 
التقنيات (2012 12111131116). وبدون مثل هذا العملء فإن صحة الببانات المتضمنة داخل 
تلك البيانات سوف تتلاثى في القريب العاجل وذلك مع انعدام الثقة. 


وعلى النقيض من ذلك» ادعى البعض أن دراسات البيانات الكبرة ليست بحاجة إلى 
تطبيق معايير جودة وصحة البيانات ذاتهاء وذلك يرجع إلى أن الطبيعة الكلية طمجموعات 
البيانات الكبيرة "ن- الجميع" (2-211 ) تجعلها تتخلص من التحيزات المتعلقة بتحديد 
العينات» وتقوم بالتعويض» أكثر من المطلوب» عن آي أخطاء آو ثغرات أو تناقضات ف 
البيانات أو أي ضعف في .(Mayer-Schonberger and Cukier 2013) SLOLJI dmo‏ 
فالحجة التى استندت إليها وجهة النظر هذه أنه "مع وجود عدد قليل من الأخطاء ال مرتبطة 
بتحديد العينةء هكننا تقبل أخطاء أكبر مرتبطة بالقياس" (ص 13).» "ويمكننا التسامح مع 
عدم الدقة" (ص 16). إن الثمن امقابل ل "ن- الجميع" (11ه-2) هو قبول الفوضى التى 
نشأت بشكل كبير من جراء صعوبة تنظيف السانات ذات السرعة العالية وغير المنظمة: 
وتقبل البيانات كونها "محتملة أكثر من كونها دقيقة" (ص 35). وعند النظر إلى الأمر 
Ula HS WS " al (Mayer-Schonberger and Cukier 2013) „e3 Äi hI oig‏ 
بيانات أكثرء كان ذلك أفضل" أو للتعبير عن هذا الأمر بشكل آخرء "إذا كان لديك بيانات 
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كقرة شد js .(Helland 2011) "àl$ à» juo luu Aso d,3l$ do juo dam s ls DIS‏ 
تم فقد ادعى )211 :2012( ol Franks‏ امطلوب هو "بيانات نظيفه بدرجة كافية". وهي 
البيانات التي تمكن ال محللين من "الحصول على النتائج التي مكنهم الوثوق بها". وبالطبع 
فإن هذا يفترض أن جميع استخدامات البيانات الكبيرة سوف تتسامح مع عدم الدقةء في 
حين أن الواقع يشير إلى أن الكثير من استخدامات البيانات الكبيرة تتطلب الدقة بشكل 
كبيرء أو على الأقل بيانات ذات معايير الأخطاء التى يمكن حسابها أي بيانات موثوقة. فعلى 
.JULI LL‏ فإن موقع خريطة الطريق ال مفتوح J òl JI Sy (OpenStreetMap)‏ 
في مستوى منتجات الخرائط الاحترافية من حيث التفصيل والدقةء ويهدف كذلك إلى كسب 
AAS‏ مستخدميه كونه ا من مصادر المعلومات. وعلى النحو ذاته. تهدف موسوعة 
ويكيبيديا (412ءم117114) إلى أن تكون موسوعة دقيقة وموثوقة مثل الموسوعات الأخرى. 
وبطريقة مماثلة يتعين أن تكون البيانات المالية والبيانات الطبية دقيقة وصحيحة من أجل 
أن تغرس الثقة في نفوس التجار والأطباء والمرضى... والقائمة تطول. فمثل وجهة النظر هذه 
تفترض Lao]‏ أن سّلالَة أصل البيانات وقضايا صحة وموثوقية البيانات ليست مهمة بالنسبة 
مستخدمي البيانات. 
وبغض النظر عن تسامح بعض مجموعات بيانات البيانات الكبيرة تجاه عدم الدقة: إلا 
odes ol‏ المعطيات الزيئة تؤدّقّ إلى :مخرجات (زؤايئة 'لأايزال ساريائ؛ فمجموعاتٌ البيانات 
الكبيرة التي تنشئ بيانات معيبة ورديئة» وتم التلاعب بها ومتحيزة؛ أو تنشئ بيانات ذات 
مصداقية ضعيفة» سوف تؤدي إلى تحليلات ونتائج ذات مصداقية ضعيفة وسوف تكون 
الفوائد المرجوة منها قليلة للغاية بالنسبة لهؤلاء الذين يحللون ويستفيدون منها. ويمكن 
للبيانات الكبيرة» عن طريق طرق إنتاجهاء أن تعاني من جميع العلل فالبيانات يمكن أن 
تكون معيبة ورديئة من خلال أخطاء الأداةء حتى عبر التقنيات التي يفترض أن تكون ذات 
دقة عالية للغاية مثل نظام التموضع العالمي (6725) والذي تختلف دقته من جهاز لآخر 
وعدد الأقمار الصناعية المتوافرة في وقت معين من الأوقات )2013 (Dodge and Kitchin‏ 
أو من الممكن آن يكون قد تم التلاعب أو التزوير في البيانات من خلال حسابات مزورة أو 
القرصنة من أجل التأثير على الاتجاه العام وتوجيه العامة نحو مسارات محددة (2013 1715). 
فعلى سبيل المثال» هناك مئات الآلاف من الحسابات المزيفة على تويترء وهي تشكل ٤.٥‏ 
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من إجمالي حسابات اممستخدمين على تويتر )2013 (De Micheli and Stroppa‏ وأيضا فان 
حتى ٤٥‏ من حسابات بعض العلامات التجارية لمتابعي تويتر هي Calzolari) åJ oLlu>‏ 
o 319 (2012‏ 355 من الخدمات تبيع حسابات تويتر مزيفة (2013 ”ره8). 

فالبيانات يمكن أن تتسم بالتحيز جراء بعض الأسباب. إن الخصائص السكانية التى 
يتم اختيارها في العينات نادراً ما تكون شاملة وتتشوه إحصائيا من قبل الجنس» والنوع 
والدخل» والمموقع» والعديد من العوامل الاجتماعية والاقتصادية الأخرى. فليس جميع 
الأفخاص يستخدمون تويتر أو الفيسبوك أو يتسوقون من محلات معينة:. أو يكونوا 
مشتركين قي شبكة الاتصالات ذاتها... Bollier 2010; Graham 2012; Crampton) èJ!‏ 
2 |ه .)٠٤‏ فالتقنبة المستخدمة والمعابر المطقة تؤّثر على طبيعة السبانات. فعلى 
سميل المغا#اشكن أن يتأثر تحديد المشاركات الأكثر قراءة de dS Lice 9l‏ وسائل التواصل 
الاجتماعي بشكل كبير من خلال خوارزميات الترتيب وليس الاهتمامات البسيطة (12ت82 
23). وعلى النحو ذاته»: فإن واجهات برمجة التطبيقات تنظم ماهية البيانات التي يتم 
استخلاضهاء ففي تويتر. على سبيل eco «JULI‏ التقاط الوسم المرتبط بالحدث وليس جميع 
التغريدات ذات الصله )2013 tal (Burns‏ فقد 35 Gonzales - Bailon et al)‏ 
2) أن اختلاف طرق الوصول إلى بيانات تويتر - البحث في واجهات برمجة التطبيقات 
مقابل تدفق واجهات برمجه التطبيقات - يؤدي إلى الحصول على مجموعات مختلفة من 
النتائج. ونتيجة لذلكء لا توجد أي ضمانات بأن فريقين من الباحثينء على سبيل JELI‏ 
الذين يحاولون جمع البيانات ذاتها في الوقت ذاته سوف يكونون قادرين في نهاية ا مطاف 
على الحصول على مجموعات السانات ذاتها (2013 5م:ا8). وعلاوة على US‏ فإن اختبار 
البيانات الوصفيه والمتغيرات التى يتم توليدها والبيانات الوصفيه والمتغيرات التي يتم 
تجاهلها يؤدي إلى رسم صورة معينة. ومثل هذه التحيزات تؤدي إلى انحراف أو حتى إلى 
نشوء أفكار واتجاهات وأشخاص ونماذج مستترة لم يتم تصويرها أو تمثيلها في مجموعة 
السانات (2012 31:3112121)). 

وفيما يتعلق بمصداقية البيانات» فإن الحال لا يتمثل دوما ف أن البيانات تعبر بصدق 
عما تم استخدام البيانات من أجل قياسه. فعلى سبيل «JULI‏ هناك علامات استفهام 
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حول مدى حقيقة ودقة تعبير المشاركات في وسائل التواصل الاجتماعي عن وجهات نظر 
الأشخاص» وعلى مدى الوثوق في مثل هذه المشاركات. وقد حذر (2011:6) Manovich‏ 
yl‏ إن "امشاركات» والتغريدات» والصور التي تم تحميلهاء والتعليقات» وجميع الأشكال 
امختلفة من المشاركات على الإنترنت لا تعتبر نوافذ شفافة بذاتهاء وبدلا من ذلكء فهى Ut‏ 
مرتبة بعناية وتتم إدارتها بشكل منتظم وذلك من خلال الانتقادات نفسها التي تنطبق على 
.(Focus Group) "SHl ole garag OLLI Slo‏ وأبدى آخرون شكوكهم حيال 
صحه بيانات hdl J44xJIs (Citizen Science) 4 Zblsll ele‏ وحذروا من جهل 
وعدم مقدرة الحشود على التنبؤ ومخاطر التفاوت (فيما يتعلق بالتغطية)ء والمتغيرات 
(فيما يتعلق بالجودة والتجانس)» وتوليد البيانات المتحيزة المتأصلة في مشروعات المساواة 
الكبرىء التي تفتقر إلى القادة وتتشكل من مجموعة ضيقة من السكان ذوي التباين في 
المهارات والدوافع )2007 .(Carr‏ وق الواقع» فإن وسائل التواصل الاجتماعي يهيمن عليها 
نخب رقمية غير ممثلة (2009 dl i> È (Crutcher and Z20 ٥k‏ هناك مجموعات كبيرة 
من المجتمع مثل الفقراء وكبار السن لا ينخرطون في وسائل التؤاصل الاجتماعي أو يفتقرون 
إلى الهواتف الذكية. ومن ثم فإن أي بيانات يتم جمعها لا تعكس بالضرورة وجهات نظر 
هؤلاء الأشخاص أو أحيائهم (2013 0121810:04). ومن ثم فمن الضروري للغاية أن يتم 
تحديد ووضع مثل هذه التحيزات في الاعتبار وذلك .عند تحليل البيانات من أجل كسب 
فهم أكثر شمولية للظاهرة. وخصوصا إذا ما كان سيتم استخدام مثل هذه البيانات في أعمال 
السياسة العامة والقرارات التي تؤثر على حياة الناس كالنتائج الصحية. 

وعلاوة على ذلك. يوجد بعض المخاوف بشأآن جودة وتجانس ال محتوى والسانات الوصفية 
التي تم تكوينها عبر أفراد متنوعي المهارات والدوافع» ومخاوف بشأن كيفية توفير درجات 
موثقة من الاعتمادية وتكوين إحساس بالمصداقية (2013 <تداءغ)ة1 20د .)(odge‏ وقد 
أدى هذا بالبعض إلى افتراض أن عمل التعهيد الجماعي "الهواة" سيكون إجراؤه بشكل 
أفضل إذا بذل على تصحيح وتنويع البيانات وليس على تكوين البيانات )2007 (Carr‏ 
فالمثال الذي ألقى 0:1 الضوء عليه هو موسوعة ويكبيدياء إذ على الرغم من كونها 
شهيرة وشاملة: إلا أنها تتوسع بشكل غير مدروس تماثل الاهتمامات المختارة للمشاركين: 
ويوجد بها مقالات غير كاملة وأحيانا مكتوبة بلغة ركيكة وتافهة ومطعون في صحتها بشكل 
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كبيرء مما بقوض حجيتها وإمكانية استخدامها أو نفعها. وادعى +031 أنه " إذا كانت 
ea‏ 2 وغ وو asi] ab Sal ia a‏ .08918 2 ی اک ق ا 
تلك العيوب." (2007:4). ويممكن أن تعانی (OpenStreetMap) e 3:21! (à: 12J! 4s‏ 
سوءَ التغطية في بعض الأماكن حيث يوجد عدد قليل من المتطوعين. ويوجد أيضا بعض 
المخاوف بشأن استدامة أعمال التعهيد الجماعي التطوعية. حيث ادعى 2007 :021 أن 
الارتباطات التى تربط مجموعة افتراضية من الناس lo‏ عادة ما تكون ارتباطات سطحيمة؛ 
وهي تفتقر إلى العمق والالتزام الإجباريء وعادة ما تكون عرضة للتشتت» وهي تعتمد 
بشكل كبير على مجموعة أساسية صغيرة لكي تحافظ على سير المشروع وتوفر الجزء الأكبر 
من العمل. وعلى النقيض من ذلكء لاحظ البعض أنه فيما يتعلق 5 OpenStreetMap‏ 
فإن جودة البيانات المقدمة تطابق جودة البيانات التى تقدمها الشركات الاحترافية وآن 
التغخطىة متنوعة )2011 .(Haklay 2010, Mooney at al‏ 

فهذه المناقشة تلقي الضوء على أن كون مجموعة البيانات كبيرة للغاية من ناحية 
الحجم: فإن هذا لا يعني بالضرورة أنها عشوائية أو ممثلة للضاهرة أو صحيحة أو ذات 
مصداقية أو موثوقة. وكما -& )2012( Crawford‏ 320 509:0 : "كون البيانات الكيرة 
تزودنا بكميات هائلة من البيانات: فإن هذا لا يعني أن القضايا ا منهجية لم تعد ذات 
صلة. ‏ ففهم العبنة على سبيل zal SI aso «JULI‏ الآن عما كان عليه الأمر في الماضي" 
(ص 668). وبالنسسة ل (615 :2009) là Kelling et al.‏ هذه القضية تعتير قضية أصل 
ومَْمَّ أي "المعلومات المتعلقة بأصل وتعريف وملكية وبنية" مجموعة البيانات التي تمكن 
محللي هذه البيانات من معرفة كيفية تكوين هذه البيانات ومعالجتهاء. وتمكنهم كذلك 
من تقييم جودة وصحة البيانات. وعلى الرغم من ذلكء فإن مصدر معظم مجموعات 
نيانات السانات الكييرة مقيد بهؤلاء الذين قاموا بإنشاء اسيانات: مما يجعل من الصعوبة 
مكان تقييم صحة الدراسات المنشورة التى اعتمدت على هذه البيانات. فأحد التحديات 
الرئيسية التي تواجه البيانات الكبيرة يتمثل في المقدرة على معرفة تفاصيل سلالة الأصل 
والذي يشمل تقييمات مستويات الأخطاء والشكوك في مجموعة البيانات» وإنشاء وسائل 
فعالة للتحقق من وتنظيف ومعايرة البيانات عالية السرعة وشديدة التنوع. 


v‏ ثورة البيانات البيانات الكبيرةء والبيانات اممفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها 





AZ 


المكتبة الاقتصادية 
قناة المكتبة ECONLIBRARY psu de‏ @ 


القضايا الفنية والتنظيمية 


:(Data Integration and Interoperability) دمج وتوافقية البيانات‎ 

إن أحد الوعود التى انبثقت عن ثورة البيانات هو إنشاء مجموعات بيانات ذات ترابط 
قوي مما يمكن هذه المجموعات من أن تتحد سويا من أجل إنشاء قيم ومعارف إضافية. 

وكما اتضح من خلال تطور البنى التحتية للبيانات ومدمجي البيانات» فإن العديد من 
البيانات عرضة لي تندمج مع بعضهاء واتضح أيضًا أن الكثير من البيانات تظل منعزلة 
في مستودعات أو يمكن دمجها فقط من خلال معالجة إضافية كبيرة. ومن أجل أن يتم 
دمج البيانات في مجموعات بيانات جديدة» أو استخدام هذه البيانات بالاشتراك مع أي 
بيانات اخرىء فإن هذه البيانات تتطلب حقول تاشيريه مشتركة وتوفر معايير البيانات» 
وبيانات وصفية متسقة» وتوافق على مستوى التنظيم والصيغة. وفي حين أن تقدما كبيرا 
قد حدث ف إدارة البيانات وتطبيق معايير البيانات التى قادتها منظمات مثل المنظمة 
الدولنة للمعايير (150) وزابطة الشبكة العالمية (©1173) واتحاد اللعلومات المكانية 
المفتوحة (©6©) فى سبيل المحاذاة بين البيانات والبيانات الوصفية وتحسين التوافق بين 
المنصات التقنية ال مختلفة التي تعالج البيانات وتحتفظ بهاء وتطوير البيانات المترابطة. 
إلا أن الكثير من مجموعات البيانات لا يمكن ربط بعضها ببعض. فهي تشكل ما أطلق 
Singh (2012) ade‏ مصطلح "السانات الجانحة" (10262 561:2110160). 

إن معظم دراسات البيانات الصغيرة لا تزال تتش تنشئ بيانات جانحة كونها تستخدم لغات 
توصيف خاصة بها وأنظمة تنظيم البيانات التي تناسب الأغراض التي سيستخدمونها فيها, 
ولكن القليل من هذه الدراسات تضع ف اعتبارها قضايا التوسع والربط. وهذه هي أيضا 
الحال غالبا داخل المنظمات التى يوجد بها إدارات منفصلة تستخدم أنظمتها الإدارية 
والتصنيفية الخاصة. فعلى سبيل المثال» فإن كل واحدة من هيئات التخطيط التي يبلغ 
عددها شمان ونمانين هيئة في إيرلندا تستخدم نظامها الخاص لاستخدام الأراضي وتصنيف 
المناطقء وعلاوة على ذلك. فهذه الهيئات توظف العديد من المنصات التقنية المختلفة 
لغرض إدارة وتخزين وتخطيط البيانات» فربط جميع هذه البيانات وتوحيدها قي نظام 
وطنى واحد ليس مهمة سهلة على الإطلاق. وباممثلء فإن توسيع مجموعات البيانات 
الوطنية سوف يواجه مشاكل مماثلة. فعلى سبيل ال مثال» فإن ربط الإحصائيات السكانية 
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في إيرلندا وإيرلندا EE E SS a N aa ak‏ 
بفرض عددا من التحديات الفنية وذلك يرجع الى أن <۳١‏ من الأسئلة متطابقة, و70 
أخرى من الأسئلة ممكن أن يتم مضاهاتها وذلك من خلال تقسيم خطط التصنيف وإعادة 
تجميعها في الخطط ال مشتركة. وحتى إذا تم هذاء فإن البيانات ستكون ذات جغرافيات 
إحصائية ضمنية مختلفة يتم تجميعها في وحدات مختلفة الأحجام )2007 Kitchin et al‏ 
وتتضاعف هذه القضايا عبر قارة أوروباء حيث تتبع كل دولة وكل مؤسسة إجراءات 

مختلفه (وحدات وتصنيفات)»ء وتعتمد فترات زمنيه متفاوته (عدد المرات التي يتم فيها إنشاء 
البيانات)» وتستند إلى آماكن متباعدة (الجغرافيا الإحصائية). وتستعمل تقنيات مختلفة 
(الصيغ). ومن ثم فلقد استنتج (118 :2012) 10166146 أنه حتى مع وجود بيانات حكومية 
شاملة. إلا أنها في غالب الأحيان تتصارع تحت وطأة الأعداد التي لا تحضى من مجموعات 
البيانات المتضاربة وغير المتوافقة وغير الصالحة للمقارنة. وتسعى بعض المبادرات مثل 
توجيهات إنسبير (:182152111) (البنية التحتية للمعلومات المكانية في الملجتمع الأوروبي) 
إلى تكوين بيانات مشتركة عير الجغرافيا الأوروبية الاحصائية المشتركة:» ولكن الوصول إلى 
توافق في هذا الشأن يعتبر عملية بطيئة وذلك يرجع إلى أن جميع الولايات لا ترغب 
في الانتقال بشكل أحادي (أي من طرف واحد) إلى نظام جديد ULL‏ وخلال العملية 
يوقفون سجلاتهم الزمنية ويفقدون مقدرتهم على إجراء تحليلات زمنية متتالية. إضافة 
إلى أن كل ولاية لها أولويات مختلفة فيما يتعلق بالبيانات التي ترغب في إنشائها وتتبعها. 
وتوجد هذه التحديات نفسها فيما يتعلق بالبيانات الكبيرة, والتي ربما تكون غير 

متجانسة وغير منظمة بشكل كبير AU‏ ومتفاوتة فيما يتعلق بالجودة» وهي أيضا مرنة 
وقابله للتوسع. فربط وتجميع مثل هذه البيانات ليس مهمة سهله على الإطلاق وهى 
تتطلب تطوير مجموعة جديدة من الأدوات والأسالس: وكذلك إنشاء وتبني معايير جديدة 
للبيانات. فأحد الحلول المطروحة: والذي şa Short et al (2011) aJ lèl‏ دمج البيانات 
المخصص والذي يمكن المستخدمين من التحكم بسرعة وبشكل مباشر في أي من البيانات 
التى سيتم دمجهاء وذلك على الرغم من أن هذا يتطلب أن تكون مجموعة الّبيانات تتمتع 
بسمات معينة مثل البنية التحتية الدلالية المؤثرة. إن ربط وتجميع مثل هذه البيانات 
a ose cios‏ يؤدي إلى التلوث المتقاطع (01162111111261011)-1055)) بسبب البيانات 
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ذات الجودة الضعيفة والحالة المتهالكة مما يؤدي إلى فساد وتلويث مجموعات البيانات 
الفعالة ويحولها إلى مجموعات بيانات ضعيفة. ومع ازدياد طوفان البيانات» فإن إيجاد 
الحلول التى تساعد على دمج البيانات وتوحيدها وتحافظ على سلامتها وفعاليتها سيمثل 
قضية ملحة:, وذلك على الرغم من أن عدم المقدرة على ربط البيانات له جوانب إيجابية 
أيضا وذلك فيما يتعلق بتقييذ مراقبة البيانات وتحسين أمن البيانات (انظر الفصل العاشر). 
التحلىل الركىك والمغالطات ال :(Poor Analysis and Ecological Fallacies)‏ 

جميع النتائج التي يتم التوصل إليها من الدراسات تكون دقيقة وسليمة وقوية بحسب 
البيانات التى تم استخدامها والتحليلات التى أجريّتء وإذا ما وضعنا جودة وصحة البيانات 
جانباء فخلال تصميم أي بحث يكون من اللهم للغاية استخدام منهجية ملائمة وآليات 
مناسبة. فالإخفاق في فعل ذلك سيؤدي إلى مغالطات بيثية خطيرة عند تفسير النتائج: 
بمعنى استخلاض النتائج المضللة والتي في الواقع لا تدغمها البيانات المستخدمة. وهناك 
تاريخ طويل من ال مساجلات التي تتعلق بمكامن القوة والضعف النسبية في العديد من 
الأماط والأساليب المنهجية ال مختلفة. والظروف التي يمكن فيها تطبيق مثل هذه الأنماط 
والأساليب بشكل صحيح. وعلى وجه العموم: هناك الآن إرشادات وقواعد محددة بشكل 
واضح تتعلق بكيفية تكوين وتحليل أنواع مختلفة من السانات عبر أنظمة متعددة. وعلى 
الرغم من ذلكء؛ وفيما يتعلق بالبيانات الكبيرة» فإن علوة البيانات لا تزال في أطوارها 
التمهيدية. ومثل هذه المعايير لا تزال في طور التشكيل والصياغة:» فآليات جديدة يتم الآن 
اختراعهاء وتوسيعهاء وتقييمها. 

وهناك أربع قضايا منهجية تتعلق بالبيانات الكبيرة جذبت الانتباه» فأولى هذه القضايا 
تتمثل في الإجابات المتفاوتة بشكل عميق والتي تؤدي إليها الافتراضات والمقاربات داخل 
النماذج (2012 :51176). وثانياء مدى قدرة الآليات والأساليب المستخدمة على إحداث 
الاستسقاطء أي رؤية واستخلاص أنماط من البيانات العشوائية التي لا معنى لهاء أو إحداث 
فرط التعلم أو املاءمة (207:1116]1118)) والتىي تحدث عندما يصف نموذج إحصاني خطأ 
Glas e‏ أو ضحجيحًا بدلا من العلاقة الكامنة )2012 «(boyd and Crawford‏ أو الخطاً 
في التعامل مع التشويش على أنه معلومات (2013 اعو516 :2012 C J6s .(Silver‏ هذه 
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القضايا يتمثل في الاتهامات بأن بعض الآليات المعينة تؤدي إلى ما هو أكثر بقليل من 
.(Data Dredging) (Webster 2011) 5 5UJI ca ,25‏ وار إذا كان بإمكان الاليات 
òl‏ تتوسع خارج نطاق بيانات ضبط الاختبار إلى مليارات السجلات المتدفقة في العام 
الواقعى )2008 (Bryant et al,‏ 


إن النماذج تهدف إلى توضيح والتعبير عن العلاقه بين المتغيرات وكيفية عمل النظام. 
فكل نموذج يتم تأسيسه على نظرية معينة, وبناؤه باستخدام مجموعة من الافتراضات 
والمقاربات التي تبين كيفية تفاعل المتغيرات» في حين أنه يتم اختبار صحة النموذج من 
خلال البحوث التجريبية: فإذا كانت النظرية والافتراضات غير صحيحة. فإن جميع التنبؤات 
ستكون غير صحيحة في هذه الحالة كذلك. وحتى التغييرات الصغيرة للغاية على الافتراضات 
في نموذج يمكن ما أن تؤدي إلى نتائج مختلفة تماما. ففى حالة الأزمة المالية العالمية التى 
حدثت في العام 2008 ادعى (2012 5111761) أن أحد العوامل المهمة للغاية في إحداث 
مثل هذه الأزمة كان استخدام نماذج تمويل دمجت المخاطر بحيث ممكن حساب احتمالية 
الدخل المحتمل مع الارتياب لأن المخاطر المحتملة من الصعب تقييمها. ونتيجة لذلك: 
اعتمدت النماذج على افتراضات غير يقينية ولكن تم معاملتها كما لو كانت مخاطر معروفة 
على وجه اليقين. والنتيجة كانت افتراض أن السندات المالية الجديدة التي يحيط بها 
ارتياب نظامي عال للغاية هي أصول ذات مخاظر منخفضة: وهذا افتراض ثبت أنه خاطئ. 
tr‏ الأنظمة nem‏ فإن مثل هذه الأخطاء لا يتم e ula‏ اشاس ذرجات ولكن يتم 
قياسها على أساس ترتيبها حسب الأهمية. وقد قدرت مؤسسات ستاندرد أند بورز وموديز 
blas (S&P and Moodys)‏ التخلف عن الدفع والمرتبطة بالتزامات الديون المضمونة 
(1009©) بأقل من قيمتها بعامل من مائتين (45 :2012 511761). وبغض النظر عن جودة 
البيانات الضمنيةء فإذا كان النموذج خاطئاء فأي نتائج يتم استخلاصها من هذا النموذج 
ستكون خاطئة كذلك. 

لقد افترض )2013( Granville (2013) and Taleb‏ أن dis)‏ أو SAA‏ السيانات الكييرة 
مُضاعفة. نتيجة العلاقات الإيجابية الخاطئة بين البيانات؛ وأنماط مجموعات البيانات التى 
تكون عرضية بشكل تام. وليس لها أي قوى تنبؤية:» ولا يمكن تكرارهاء وربما يمكن أن 
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تكون قناعا لنماذج أضعف ذات أهمية: فمجموعات البيانات تشتمل غالبا على البيانات 
التي يبدو أنها مرتبطة بعضها البعضء حتى ولو كانت العلاقة بينها عشوائية في الواقع. 
ومع زيادة حجم مجموعة البيانات» تتضاعف الأخطاء الإيجابية: إلى الحد الذي تكون فيه 
أي علاقة تقريبا بين البيانات مهمة من الناحية الإحضائية وفق معايير اختبارات الارتباط 
Aes .(Pentland 2012; Rajaraman et al. 2012; Taleb 2013) 4137!‏ | النحو ذاتهء 
ففي أساليب التنقيب عن البيانات» مثل شجرة القرارات (تسلسل اتخاذ القرار)» يمكن أن 
يتسم النموذج بفرط الملاءمة ى يتم استنباط نتائج استثنائية تحول إلى نتائج قابلة للتعميم 
مما يؤدي هذا إلى حدوث مغالطات بيئية. فالبيانات الكبيرة في هذه الحالة لا تعني معرفة 
أفضل» ولكنها تعني بالأحرى ارتباكا أكثر وذلك من جراء صعوبة تحديد دالة حقيقية وسط 
ركام من الدلالات. ولذا فإنه: " أحيانا يكون الأقل Verhulst) "3b (5588! sa‏ 5 الاقتباس 
من 2012:14 .(Bollier‏ 


إن أحد الجوانب المهمة في مشكلة الأخطاء الإيجابية ليس حجم مجموعة البيانات 
ecuun‏ بل كيفية معالجة وتحليل مجموعة البيانات هذه. فأحد أجزاء إستراتيجية الكثير 
من تحليلات البيانات الكبيرة يتمشل في فحص مجموعة البيانات قبل صياغة الافتراضات 
(انظر الفصل السادس). ومن الطرق المتبعة للقيام بهذا الأمر حساب الارتباطات بين 
جميع المتغيرات وذلك من أجل تحديد العلاقات المحتملة بين البيانات الجديرة بالدراسة 
الإضافية. وتشكل هذه العملية ما يعرف بتجريف البيانات (106081128 10262) والتى 
تسمى أحيانا تصيد البيانات» وهي ممارسة لا يحبذها بشدة الكثير من الخبراء الإحصائيين 
.)Webster 2011; Piatetsky-Shapiro 2012)‏ فا مشكلة التي ترتبط بهذا المنحى 
مشكلة مزدوحة. فمن dar‏ هي تحدد آلاف الأخطاء الايجابية المحتملة وذلك دون 
تحديد 6 من هذه الأخطاء عشواني "ur‏ منها ذو مغزى. ومن جهة أخرىء ممكن أن $59 
إلى التنقل من متجر لآخر طلبا للأرخص وعرض النتائج التي تؤكد اعتقاد المحللء مع وجود 
دليل من التحليل ال مستخدم من أجل أن يجعل الادعاء يبدو معقولا Webster) Lus jas‏ 
3 م«اء121 :2011). فالسؤال الشائك الذي e a»‏ نفسه هناء كما Granville) jL5l‏ 
3)» هو كيف ممكن التمييز بين دالة حقيقية ودالة عرضية وسط الكميات الهائلة من 
البيانات؟ وكيف يمكن ألا ينقاد المرء للاستسقاط وفرط التعلم؟ 
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إن هناك بعض الحلول الممكنة. حيث اقترح (2015) .21 ]© 113[21311811 استخدام 
(Bonferroni) ggg |a‏ والذى يسعى إلى تحديد الأحداث النادرة lae‏ لدرحة أنها 
لا مكن آن تحدث ف البيانات العشوائيةء وذلك من أجل فرز الارتباطات الفعلية عن 
الارتباطات العشوائية. كما كان (2013) )یس1 من أنصار استخدام مستويات معيارية 
معززةء وذكر نقطة انطلاق معيار خمسة سیجما (۵ع1؟ ۴1۷۲) المستخدم حاليا ف الفيزياء 
من أجل مواجهة الارتباطات الوهمية وإعلان الاكتشافات (احتمال كون النتائج خاطئة 
وناتجة عن التغيرات الإحصائية فقط هو واحد في كل ثلاثة ملايين وخمسمئة آلف أو 


بيانات أخرىء أو التقسيم العشوائ لمجموعة البيانات الحالية إلى عينات ومعرفة إذا ما 
كانت العلاقة أو الارتناظ سيظل مفوجوذا غير الغنتات (2000 Slad lasg (Jenseni‏ 
بفرط التعلم» ناقش (2010) :141116 إستراتيجية استخدام الخلفية المعرفية» والتي تتكون 
من استخدام الحقائق ال معروفة عن مجموعة بيانات مستقاة من الافتراضات عن النظام 
والحقائق الملاحظةء ومعرفة الخبيرء أو النظرية: أو المقاييس الممتعة والمرغوب فيها التى 
تقيم البساطة والتيقن والفائدة والحداثة للأنماط المستحدثة. وذلك من أجل فصل الأنماط 
الهادفة عن التشويش. es‏ الرغم من ذلك» فمن الواضح أن هناك حاجة لبذل أعمال 
إضافية من أجل تطوير أساليت لتقييم المغزى والدلالة. في عصر البيانات الكبيرة. 

وإذا وضعنا في الاعتبار أن تحليلات البيانات لا تزال في مراحلها الأولى من التطور, وتم 
تطبيقها بالدرجة الأولى على بيانات الضبط والاختبارء يظل أيضا هناك بعض المخاوف 
بشأن فعالية مثل هذه الأساليب في مجاراة البيانات الفوضوية وغير ا منضبطة. وكما أشار 
.Byrant et al. (2008: 4)‏ فإن "الكثير من الخوارزميات لا تتوسع خارج نطاق مجموعات 
البيانات التى تتكون من بضعة ملايين من العناصرء أو لا يمكنها أن تتحمل التشويش 
والثتغرات الإحصائية الموجودة في بيانات العام الواقعي". فإذا كان هناك أي اختلالات أو 
تحيزات موجودة فى الخوارزميات» فمن شأنها أن تؤدي إلى انحراف النتائج وتفسيرات هذه 
-3924Jl lap 3559 .(byoed and Crawford 2012) e UI‏ أيضا القلق من أن هناك 
اعتمادا مفرطا والكثير جدا من الموثوقية الموضوعة في الخوارزميات وذلك من أجل إجراء 
التحليلات» واستخراج ال منافع والمزايا التي تجلبها الخبرات وا معارف والفطرة البشرية من 
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أجل 3$ 8,205 .(Lohr 2012) Ls‏ ومن ثم هناك حاجة لإجراء المزيد من العمل من 
أجل تأسيس وتقييم صحة التحليلات الجديدة والثقة في النتائج التي يمكن استخلاصها من 
هذه التحليلات. 

ومن الانتقادات الأآخرى الموجهة إلى تحليلات السانات الكييرة هو تركيز هذه السانات 
على الآنية (هنا والآن)ء وذلك بالنظر إلى حداثتهاء وعلى وجه العموم» فإن البيانات الكبيرة 
تفتقر إلى العمق التاريخي. فشبكات الاستشعار الجديدة أو بيانات التعهيد الجماعي يمكن 
أن توفر بيانات مستمرة وثرية» ولكنها تتسم بقصر الفترات الزمنية التي تغطيها. ونتيجة 
لذلكء فإن الكثير من التحليلات تكون مناسبة في وقتها ولكنها تفتقر إلى العمق الزمني. 
وهذا أمر لا غبار عليه ومستحسن إذا كان الشخص REV‏ بالوقت الحاضر Dda gi‏ 
ممتد باستخدام وسائل التواصل الاجتماعي (على سبيل المثال حدث سياسي كبير مثل الربيع 
العربي)» أو أن يكون الشخص قائما بتحليل عملية مادية لا تتغير بمرور الوقت (مثل تجربة 
فيزيائية)::ولكن سيكون الأمر baiia‏ للمشاكل إذا تم استخداقه من.أجَلإفهم العمليات 
التي تمتد لآلاف السنين أو أكثر (على سبيل المثال الأنظمة البيئية والجيولوجية). وينطبق 
هذا الانتقاد أيضاء بالطبع» على دراسات البيانات الصغيرة. والتي تعتبر أيضا لقطات تم 
اتخاذها في أماكن معينة وأوقات محددة. 


المهارات والموارد البشرية :(Skills and Human Resourcing)‏ 
في حين أن بعض تحليلات البيانات يتم تركها للخوارزميات» وخاصة العمل المتعمق 
للمعالجة والحسابات. إلا أن أعمال التوجيه والتفسير لا تزال إلى حد كبير حكرا على المحليين 
البشر. فبالاعتماد على مهاراتهم وخبراتهم ومعارفهم» يتخذ الباحثون والمحللون القرارات 
المتعلقة بالأماكن ال مثلى التي ينبغي التركيز عليهاء وكيفية صياغة وإجراء التحاليلء وإدراك 
المراد من النتائج والعمل على هذه النتائج. فالبشر يظلون هم الفاعلين الأساسيين في تأسيس 
وتشغيل والمحافظة على المشروعات التى تقودها البيانات» فعلى سبيل المثال» يتطلب تأسيس 
بنية تحتية للبيانات مهندسي برامج وأجهزة ومسئولين رقميينء وأخصائيين في السياسة وخبراء 
مجالات علمية ومحللين. فهؤلاء العاملون يضمنون تصميما جيداً للنظام ي يُنتج بيانات 
مفيدة وصحيحة وموتوقة» ويوفرون الوسائل الضرورية لتخزين ومشاركة البيانات» ويؤمنون 
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مجموعة من الأدوات التحليلية والإدارية ا مناسبة: التى يمكنها استخلاص القيمة وال معرفة. 
وهم يعرفون أيضا ماهية الأسئلة التي ينبغي توجيهها وما الذي يتعين فعله بالإجابات على تلك 
الأسئلة. ولذاء فإن المواهب البشر ية بضاعة رائجة. ولكن وكما آشارت بعض التقاريرء هناك 
نقص متزايد في الموظفين الذين يتمتعون بمهارات في البيانات وخاصة محللي ومديري البيانات 
الذين بإمكانهم تحويل البيانات وا معلومات إلى معارف 5 Gantz and Reinsel 2011;) ele‏ 
.((Manyika et al. 2011; Shah et al. 2012; Rooney 2012‏ 


وقد أكد )2012:3( òl" Manyika et al.‏ الولايات المتحدة وحدها تعاني نقصا RLo‏ 
٠‏ إلى ۹٠,٠٠١‏ شخص بتمتعون مهارات تحليلية متعمقة وكذلك ١,6‏ مليون مدير 
ومحلل من أجل تحليل البيانات الكبيرة واتخاذ القرارات بناءً على اكتشافاتهم". واستطردوا 
بالإشارة إلى أن مثل هذه المواهب "من الصعب إيجادها إذ تستغرق سنوات عديدة في 
التدريب أو إعادة التدريس" (ص .)٠١‏ وقيم )2012( Shah et al.‏ عدد 0۰۰۰ موظف à‏ 
اثنتي عشرة شركة عامطية فيما يتعلق بمقدرتهم على معالجة تحليلات البيانات بشكل مثمر 
حيث قاموا نوضع الموظفين في ثلاث مجموعات. الأولىء التجريبيون غير المعترضين الذين 
يثقون في التحليلات أكثر من الأحكام الشخصية (57”). والثانية» متخذو القرار المتعمقون 
الذين يتجاهلون التحليلات ويتصرفون ما هليه عليه حدسهم الفطري (۱۹<). والثالثه» 
المتشككون المطلعون (#37) الذين يوازنون بين الأحكام الشخصية والتحليلات. ويسعون 
إلى تفسير البيانات ووضعها في سياقها المناسب عند اتخاذ القرارات. وبشكل مقلقء فإن 
أولئك الذين يدعون البيانات تعبر عن نفسها وأولئك الذين يتجاهلون البيانات والتحليلات 
بشكل روتيني يفوقون في عددهم أولئك القادرين بشكل أفضل على فهم البيانات الكبيرة. 
وعلاوة على ذلك لاحظوا أن الشركات تعاني من أربعة مشاكل تحول دون الاستفادة من 
إمكانيات البيانات الكبيرة وهي: 
e‏ أولا: أن المهارات التحليلية تتركز في عدد محدود للغاية من الموظفين ولا تنتشر في باقى 
الموظفين. 
« ثانيا: أن حلول تقنية المعلومات تتركز بشكل تقليدي على التقنية وبشكل أقل بكثير على 
المعلومات في حين أن المعلومات هي المجال الذي يتم من خلاله جني القيمة. 
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٠‏ ثالشا: أن تخزين البيانات يحدث كيفما اتفق ومن الصعوبة بمكان على أي موظف أن 
يحدد مكان امادة إذا لم يكن هذا الموظف هو المسئول عن جمعها. 

ه رابعا: أن المديرين يفهمون قيمة الموهبة ورأس المال والعلامة التجارية» ولكن لا يفهمون 
قيمة المعلومات» ولا يبذلون جهودا كافية من أجل فهم البيانات أو ترتيب هذه 
البيانات بشكل فعال وكفاء. 

ويوجد مثل هذا النقص ف المهارات أيضا في المؤسسات الأكادممية: حيث إن خبراء 
المجالات ال مختلفة تدربوا في وقت ندرة البيانات وهم غير مستعدين بشكل كبير لعصر 
البنى التحتية للبيانات والبيانات الكبيرة وذلك باستثناء عدد لا يتجاوز أصابع اليد الواحدة 

من العلماء وا مراكز. 

إن القلق الذي ينتاب الكثير من المعلقين هو أن المنافع المحتملة من الشركات والعلوم 
التي تقودها البيانات لن يتم تخقيقها بشكل كامل بسبب نقص المواهب البشرية وخاصة 
علماء البيانات الذين تجتمع لديهم مهارات مبرمجي البرامج والإحصائيين والرواة ال محترفين 

وذلك من أجل استخلاص شذرات الذهس الختبيتئة تحت جبال Cukier) LI p—s‏ 

0 واكديريق الذين تفهمون كيفية #روثل هذة التنذرات ال قرازات كيمة. وفيها 

يتعلق بالمديرينء وكما أشار (23 :2012) Shah et al.‏ فإن "الاستثمار في التحليلات يمكن 

أن يكون بلا جدوىء ويمكن حتى أن يكون ضاراء إلا إذا كان بإمكان الموظفين دمج هذه 
البيانات في العملية المعقدة لاتخاذ القرارات". فالجامعات بدأت الآن في إنشاء برامج 
جديدة ومراكز بحثية لعلوم البيانات» ويسعون إلى تعديل الدورات التدريبية الحالية لي 
تشتمل عاى التدريب على مجموعه المهارات الجديدة هذه» وذلك في مسعى إلى تنقيح 
بعض الثغرات المتعلقة بال مهارات. ويتم تنظيم بعض هذه البرامج بالمشاركة مع بعض 

Jo Laal go dawl $ Jeb (IBM) al y الشركات. فعلى سبيل المثال. بدأت شركة آي‎ 

الجامعات من أجل تطوير دورات ومقررات تعليمية» وهناك بعض الشركات الأخرى مثل 

e (Teradata) bl31,5 4.5 5‏ تقدم برامج تدردىسة معتمدة من lلجlمعlاتٽ Bertolucci)‏ 

73)» وذلك على الرغم من أن هذه البرامج من الممكن أن تؤدي إلى مخاطرة 442-93 

الطلاب تجاه رؤى وبرامج خاصة ببعض الشركات. 
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الجدول رقم ١(‏ - 8( 


الخبرات اللازمة لبناء البنى التحتية للبيانات وإجراء بحوث البيانات الكبيرة 


خبرات المجال ه معرفة نظرية وعملية عميقة بالمجال (المجالات) ذات الصلة. 
٠| Domain Expertise‏ المعرفة التامة بأنواع البيانات التي ستتم دراستها وأصل هذه البيانات 
وأهميتها للمجال (المجالات) ذات الصلة. 
o‏ المقدرة على تحديد الفجوات المعرفية. 
« المعرفة التامة بالأآدبيات والاتفاقيات النظامية. 
٠‏ المقدرة على تعليم الآخرين الذين يملكون خلفيات متعددة من أجل 
استيعاب كل ما ذكر „Mel‏ 
خبرات السانات o‏ فهم كيف يتم تجميع البيانات والمحافظة عليهاء وكذلك فهم العلاقات 
بين الأشياء المادية والتمثيل الرقمي لهذه الأشباء (إذا كان ذلك ممكنا). 
المعرفة التامة بنماذج البيانات و/ أو اتفاقيات وصف البيانات. 


Data Expertise 


٠‏ فهم كيف يتم الوصول إلى البيانات ذات الصلة وتخزين هذه البيانات. 

« المقدرة على تسهيل مشاركة البيانات وتصحيح الأخطاء بشكل يدوى. 
سواء كان هذا أثناء أم بعد المشروع. 

ه المقدرة على التنؤ بالاستخدامات المستقملية أو البديلة SLY‏ 

٠‏ فهم الأشكال الجديدة من المطبوعات التي يمكنها أن تحتوي على البيانات. 


الخبرات التحليلية | ه٠‏ فهم نقاط القوة والضعف ف أدوات البحث الفردية. 
Analytical Expertise‏ ه اختيار وتعديل الأدوات المناسبة لدعم الأهداف البحثية. 
٠‏ التنبؤ بالمشاكل التي يمكنها أن تنشأ مع استخدام الأدوات ا مختارة 
لتنفيد مهام ال مشروع. 


ه توقع واكتشاف معدلات الأخطاء في خوارزميات البيانات وتحليلات 
البيانات» واختيار الطرق الإحصائية التي تفسر هذه الأخطاء كلما كان 
ذلك مناسيا. 

٠‏ تعليم الآخرين كيفية تفسير نتائج البحث. 
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< امقدرة على صاغه معام اطمشروع. 
٠‏ المقدرة على تحديد الأضداف المناسبة وامواعيد النهائية وتنسيق 
مسارات العمل امتوازية إذا كان ذلك ضروريا. 


خيرات إدارة امشاريع 


Project Management 


expertise 


٠‏ المقدرة على اختيار أفضل الإستراتيجيات المناسمة للاتصال والتوثيق 


للمشروع. 

o‏ إجادة الأدوات السحثة التعاونية. 

٠‏ الإرادة القوية للعمل من أجل تحقيق النتائج التي تفيد جميع أعضاء 
الفريق. 


.Williford and Henry (2012: 16 - 20) امصدر: مقس من‎ 


إن علم البيانات ليس هو الخبرة الوحيدة التي يتعين تأسبيسها. وبحسب ما ادعى 
Williford and Henry (2012)‏ فإن تأسيس بنى تحتبة للسانات وإجراء البحوث على 
البيانات الكبيرة يتطلبان دمج أربعة أنواع من الخبرات من أجل تحقيق النجاح (انظر 
الجدول .)35-١‏ وهذه الخبرات الأربعة كما ادعى (2013) 1015616 يمكن أن يتم تحقيقها 
فقط من خلال منهج متعدد التخصصات والقطاعات» مما يسمح بتوحيد المهارات والرؤى 
التي يمكنها أن تتقاطع مع المجالات وتحقق التعاون بين المؤسسات الأكاديمية والصناعية 
والحكومية:: وحتى يأ مثل هذا الوقتء أي عندما يتطور وينضج جيل جديد من المواهب 
امناسبة. وتتطور مناهج متعددة المجالات والأنظمة: فإن المشروعات ستظل عرضة للإخفاق 
أو سوء الآداء. 





الخاتمة: 

كشف هذا الفصل عن أوجه النقص الفنية في البيانات الصغيرة المتوسعة والبيانات 
الكبيرة. وناقش أن البيانات الكبيرة تحيط بها العديد من القضايا التى تحول دون الاستفادة 
منها وتطويرها في الوقت الراهنء ومن هذه القضايا على سبيل الذكر لا الحصر النطاق 
الضيق إلى حد ما لمجموعات البيانات المتوافرة. والوصول ال محدود إلى البيانات» والجودة 
الضعيفة للبيانات» وصحة وموثوقية البيانات. وسلالة أصل السانات المحددة بشكل سيئ؛ 
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والتىادلىة الضعفة» والتحليلات المشكوك فيهاء والمغالطات didl‏ وقاعدة المهارات المطورة 
بشكل ضعيفء والاستجابة المؤسسية. وقد أدى ذلك ب )2012( Dembosky et al.‏ 
للادعاء بأن "التحركات الأولية رما تكون واعدة بشكل مفرط ولكن آداءها رما يكون أقل 
من ابلتوقع". وخضوصا عندما يضبح هؤلاء الذين يتبنون خلول البيانات الكبيرة "مُتخمين 
بسبب التقنية التي لا تزال حديثة للغاية وغير ممُنقحة. فالتقنية أضحت مرهقة ومثبطة 
أكثر من كونها مفيدة". وبمرور الوقتء فإن الكثير من هذه القضايا سيتم التعامل معها إلى 
حد ما وذلك من خلال الحلول الإدارية والفنية؛ ولكن ستظل هذه القضايا تشكل مخاوف 
Yacg baias blial ulhs‏ اصلاها متهذها. -وتنطيق الأمر 15 Coles i Le Las]‏ 
البنى التحتية للبيانات ومشروعات البيانات ال مفتوحة. وف الواقع. وكما أشرنا إلى ذلك في 
الفصل الثالثء فإن الكثير من هذه القضايا التي تؤثر على البيانات الكبيرة تؤثر بشدة في 
مشروعات البيانات المفتوحة. فعلى سبيل JULI‏ فإن بعض مواقع البيانات المفتوحة لا تعد 
أكثر من كونها مقالب نفايات للبيانات ذات المتغيرات الانتقائية» إذ إن هذه المواقع منظمة 
بشكل سيئ للغاية وهي ذات بنية ضعيفة تماما وبياناتها غير نظيفة: وهي تفتقر إلى 
مجموعات التسجيل الكاملة. والتوثيقء والسياسات المتعلقة بالحفظء والنسخ الاحتياطي: 
والتدقيق» وإعادة الاستخدام: والخصوصية والسياسات الأخلاقية. 

فنحن يتعين علينا أن نكون حريصين للغاية من أجل أن ندرك أن ثورة البيانات لا تزال 
في أطوارها التمهيدية وهي تتمتع بخصائص الجنين فيما يتعلق بالنضج والتطورء وفي الوقت 
«(al JI‏ يبدو أن التسابق يتجه نحو طرح نظم تهدف إلى استعراض الإمكانيات وتأمين حصة 
سوقية مبكرة دون بذل الجهد الكافي لتفحص المصداقية والفعالية والمنفعة» أو لتفحص 
القضايا الإدارية واموارد البشريه التي تتعلق بالجاهزيه المؤسسيهة ومجموعات امهارات 
امناسبة. وف الواقع. فإن شعار بعض المشروعات هو أن تتجه نحو ما هو مستهجن بشكل 
مبكر ثم تتعامل مع القضايا التي تنشاً على أساس انتشارها. 

ونتيجة لذلكء فإن البحوث المركزة بشكل كبير والمصممة من أجل تحديد طبيعة ومدى 
أوجه القصور الفنية وا مؤسسية للسانات الكبيرة والبيانات المفتوحة والبنى التحتية للبيانات 
لا تزال متأخرة بشكل واضح مقارنة بأعمال التطوير الأخرى. ولكن مثل هذه البحوث 
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تظل حيوية للغاية لإنشاء أنظمة تقدم اكتشافات ونتائج صحيحة. ومن شأنها أيضا أن 
تضيف قيمة كافية للمؤسسات التي تتبنى وتستخدم هذه البحوث. ويتعين أن يتم إجراء 
هذه اللحوث عير قطاعات متعددة وعير الأنواع المختلفة من السانات وذلك من أجل 
تأسيس القضايا والحلول المتعلقة بالبيانات والأنظمة المختلفة. وعلاوة على ذلكء: يتعين أن 
يتم تخصيص استثمارات من أجل زيادة وصقل مهارات الموظفين الحاليين وتدريب جيل 
جديد من علماء السانات. ودون إجراء مثل هذه اللحوثء فإن السانات الكبيرة. والسانات 
المفتوحة والبنى التحتية للبيانات رها ستعاني أضرار السمعة التي ستؤدي في نهاية المطاف 
إلى بطء في نشرها وتبنيها. وهناك مجموعة أخرى من القضايا التي ستؤدي الدور ذاته 
وهي القضايا المتعلقة بالآثار الأخلاقية والاجتماعية والسياسية لأنظمة البيانات الجديدة 
وهو ما يركز عليه الفصل التالي. 
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الفصل العاشر 


(Ethical, Political, Social, and Legal Concerns) 


كما نوقش ق الفصل السابع» يتم تكوين وتوظيف البيانات للعديد من الغايات التي 
تشمل حكم المجتمعات. وإدارة المنظمات» والتوسع ف الأرباح» وتنظيم الأماكن. وف جميع 
هذه الحالات» ثَعَّد البيانات مدخلات أساسية ف الأنظمة التي يتم تنفيذهاء للمفارقةء لغرض 
ان تک ون اقات كر أمائاء وأهناء وتنافسية, وانتاعية. وكفاءق افق along‏ على 
الرغم من آنه يتم القيام بذلك من خلال العمليات التي تراقب وتفرض النظام» وتكبح» 
وتقنع» وتجبر» وتستغل الناس. فهناك توازن دقيقء في هذه الحالةء بين استخدام البيانات 
بطرق تحريزية وتمكينية: وبين استخدام البيانات من أجل تحقيق أغراض الفرد الشخصية 
وإلحاق الضرر بالآخرين» أو استخدام البيانات بظرق تتعارض مع رغبات هؤلاء الذين 
تمثلهم هذه البيانات. ولا يتعلق الأمرء مع ذلك: بأن تستخده البيانات ببساطة في أشياء 
جيدة أو أشياء سيئة؛ فالمشكلة أعقد من ذلك بكثيز. وفي غالب الأحيان فإن النتائج التى 
تظهر على أنها متعارضة يتم تجميعها سوياً لدرجة أن الأشخاص يمكن تحريرهم أو إجبارهم 
في الوقت نفسه - وهم يحصلون على منافع شخصية في الوقت ذاته الذي يقعون فيه 
في مصيدة النظام الذي يسعى إلى تحقيق مكاسب من وراء مشاركتهم. وفي مصطلحات 
.Althusser (1971)‏ تعمل مثل هذه الترتبات من خلال الاستجوابء وتوريط الناس عن 
طريق منطقها وذلك من خلال الإقناع والحوافز. فعلى سبيل المثالء تمنح بطاقات الولاء في 
الأسواق للعملاء خصومات في الوقت ذاته الذي تعمل هذه البطاقات على تأسيس الولاء 
تجاه المتجر وتكوين قدر من البيانات التي يتم استخدامها من أجل محاولة بيع المزيد من 
البضائع لهؤلاء العملاءء مما يؤدي إلى زيادة الأرباح. وبالمثل: فإن تمن حصولك على الأمان 
من الهجمات الإرهابية هو المراقبة التي تنتهك خصوصيات جميع الأفراد في المجتمع» حيث 
يحصل ا مواطنون على الأمان مقابل خصوصيتهم. 
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إن تكوين البيانات والعمل الذي تقوم به مثل هذه البيانات محاط بشكل جوهري 
مخاوف آخلاقية» واجتماعية» وسياسية. ومثل هذه المخاوف كانت لوقت طويل مثار 
إدراك ومجادلات داخل المنتديات العامة والمنتديات العلمية: مما أدى إلى صياغة مجموعة 
كبيرة من الإرشادات الأخلاقية والمهنية والتشريعات التي تحدد كيف يتم إنتاج؛ إدارة, 
مشاركة» واستخدام البيانات. فليس هناك آي شكل من أشكال إنتاج وتحليل البيانات خال 
من مثل هذه المخاوف» وحتى المشاريع العلمية التي يبدو من الناحية الظاهرية أنها غير 
خطرة ومحايدةء هكن أن تثير آسئلة أخلاقية ويكون لها توابع اجتماعية وسياسية. فعلى 
ميل tall d alil glas csl Ol alb sag Le) «JEU‏ يكون مقتصراً عا ed)‏ 
الظواهر الطبيعية» ولكن من الممكن أن يتم استخدام ذلك أيضا في تشكيل السياسات التى 
تؤثر في حياة الناس داخل مثل هذه الأنظمة. إن مثل هذه الحوارات الأخلاقية مستمرة 
وتتطور واحدة تلو الأخرى مع المجال الاستطرادي الأشمل الذي يتعلق بالاتجاهات والاراء 
الاجتماعيةء وتطور التقنيات الجديدة. وفيما يتعلق بالأخيرة» فإن توسيع البيانات الصغيرة 
داخل البنى التحتية للبيانات» وإنشاء سوق البيانات الهائلء وفتح البيانات المؤسسية؛ 
وتدفقات البيانات الكبيرة يطرحان أسئلة أساسية أخلاقية. واجتماعية. وسياسية: إذ إنها 
تعدل بشكل جذري مشهد البيانات. إن حجم وتنوع البيانات التي يتم تكوينها عن جميع 
مجالات الحياة اليومية والعام الذي نعيش فيه اليوم ينموان بشكل مطرد» وهذه البيانات 
هي أكثر من أي وقبا مضق رمق يا منايكيية الوقيتقاد وتصعينها, وشوو لبها وترابطها. 
فما كان في الماضي Cou‏ أو Jsp‏ أصبح الآان وبشكل متزايد مكشوفا أمام Åc garo‏ 
متنوعة من المصالح. وعمليات اتخاذ القرار داخل الحكوماتء وأصبحت الأعمال توجه 
بالبيانات بشكل أكبرء ومدعومة بالدليل وأكثر اعتمادا على التقنية (تكنوقراطية). 

يناقش هذا الفصل مجموعة مختارة من المخاوف ALELY‏ والاجتماعية. والسياسية 
والقانونية التي تثيرها ثورة البيانات. وهذه المخاوف تشمل مراقبة البيانات وتعقب 
«DLL UI‏ والخصوصية. وأمن البيانات» والتشخيص.ء والتصنيف الاجتماعي والخطوط 
ilg (Redlining) elpas!‏ تعني ممارسة الحرمان أو زيادة التكلفة في الخدمات لمناطق 
لها غالبية عرقية محددة بناء على البيانات» والتحكم في الانسلالء والحوكمة التوقعية: 
وحوكمة المؤسسات, والاعتماد التام على التقنية وحوكمة الشركات والإغلاق التقنيء والملكية 
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وحقوق الملكية الفكرية. فالفصل يناقش كيفية التفكير في كل قضية من هذه القضاياء مع 
الآراء المتباينة داخل كل علم على حدة وبين العلوم ال مختلفة بعضها البعض» وكذلك داخل 
وبين الشركات والحكومات والمجتمع ال مدني ومن لديه أجندات مختلفة. ومصالح مكتسبة 
وحساسيات سياسية. ولذاء فإنه لا توجد إجابات سهله لحل هذه القضايا التي يناقشها 
هذا الفصلء في حين أن الحلول تتكون دوما من تسويات وحلول وسط. ومن المؤكد. على 
ما ذكرناء أنه كلما تنتشر ثورة البيانات» فمن المرجح أن تزداد حدة المناقشات والجدال 
بشأن هذه المخاوف. وخصوضا عند القيام محاولات من أجل صياغة تشر يعات جديدة 
للتعامل مع التطورات التقنية التي تساعد على انبثاق طرق جديدة لإنشاء وتعزيز وتحليل 
البيانات. ومن ثم تؤدي إلى ظهور قضايا جديدة مما يجعل من التشريعات والقوانين 
القدهه تشريعات وقوانين عفا عليها الزمن. 


تعقب السانات ومراقبة :(Data Shadows and Dataveillance) LUI‏ 
كما ناقشنا في الفضول السابقة» يتم تكوين كمية هائلة من البيانات في الوقت الراهن 
وذلك فيما يتعلق بال مواطنين في جميع ولايات الدولة. إن إنتاج وتحويل مثل هذه الكمية 
من البيانات ينمو ويتزايد باطراد» حيث تسعى الدولة والشركات ومنظمات ال مجتمع ا مدني 
بشكل فعال للحصول على البيانات المتعلقة مواطنيهم وعملائهم والأعضاء المشتركين في 
أنشصطتهم. وفي الواقع. أصبح من الصعوبة بمكان أن يؤدي الفرد جزءًا من حياته اليومية 
دون أن يترك أثرًا لذلك بسبب الدور غير المباشر للتقنيات الرقمية والبرامج واستخدام 
امعرفات .(Kitchin and Dodge 2011) 4JIJJI‏ فحتى ولو م يقم المشتري باستخدام 
بطاقته الائتمانية لشراء البضائع من المتاجرء إلا أن حضور هذا المشتري قد تم تسجيله 
من خلال كاميرات المراقبة» وحتى لو استخدم الشخص اسم مستخدم مجهول على وسائل 
التواصل الاجتماعي فإنه يتم تسجيل عنوان بروتوكول الإنترنت (IP Address)‏ وعنوان 
التحكم بالوصول (MAC Address) JL us‏ ومن ثم فنحن نترك آثار البيانات بشكل 
روتيني في أعقابنا؛ على الرغم من أننا في الغالب لا نمتلك السيطرة الكاملة على شكل ومدى 
وكيفية استخدام هذه الاثار. 
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Je «Koops (2011) jLL3l Ss‏ سل «JL!‏ فإن هرئة حمابة السانات الهولندية 
قدرت أن المواطن الهولندي العادي مندرج فى نحو 0٠١0 - ۲٠١‏ قاعدة بيانات» في حين 
أن المواطنين الأكثر نشاطا من الناحية الاجتماعية مندرجون فى نحو ٠٠٠١‏ قاعدة بيانات. 
ولا تشتمل قواعد البيانات هذه على الآثار الرقمية للمواطنين فحسب (البيانات التي 
يتركها المواطنون أنفسهم فى أعقابهم): ولكنها تتضمن أيضا بيانات الصور التخيلية (ة٤ة5‏ 
75 الخاصة بالأفراد (البيانات عن المواطنين التي ينشتها الاخرون)ء وهي توفر 
بشكل متزايد عملية تعقب البيانات الخاصة بالموقع والتفاعلات وال معاملات عبر المكان 
.(Clarke 1994a; Lyon 2007; Dodge and Kitchin 2005; Koops 2011) 3Lajls‏ 
وعلاوة على ذلك. ففي حين أن الآثار الرقمية والصور التخيلية للبيانات سريعة الزوال ولا 
تدوم إلا فترة محدودة للغاية: فإن النسخة الرقمية منهما تدوم بشكل كبير للغاية ويمكن 
تخزينها في قواعد البيانات لفترة 7 839455 )2011 Us (Koops‏ $385( إلى إنشاء 
عام من الممكن له أن يتذكر جميع نقاط البيانات ولا ينسى على الإطلاق (220 1000186 
(Kitchin 2007b‏ فهذه الآثار الرقمية والصور التخيلية للبيانات يتم تفتيتها وتقسيمها 
ونشرها عبر الكثير من ال منظمات والخوادم: وهي تكون عرضة للدمج والتقسيم Raley)‏ 
3. وفى أفضل الأحوال. تشكل الآثار الرقمية والصور التخيلية للبيانات القليل من 
اليرؤى — )5$( يخدوهة من ؤوايا مرتفعة جزئية من:مواقف. محددة مع إسقاط الرؤى 
المحددة (2002 111116 )Amin and‏ - وذلك بدلا من تمحيص هذه الاثار والتشخيلات 
سويا من أجل تكوين رؤية شاملة وعامة تحيط بكل شيء. وعلى الرغم من ذلكء وإذا 
وضعنا في اعتبارنا ارتباطية البيانات وقيمة تضخيم البيانات: فإن الاتجاه السائد سيكون 
تجاه تجميع وجهات النظر المحدودة من أجل تكون تصور أكثر قوة. 

وإجمالاء توفر الآثار الرقمية والصور التخيلية للبيانات سجلا مفصلا بحياة المرء اليومية: 
وأنماط استهلاكه. وعمله. وسفره. واتصالاته. ولعبه. وتفاعلاته مع المنظمات. وأفكاره 
واهتماماته. وليس الأفراد فحسب هم من يقعون تحت طائل هذه المراقبة الشاملة» ولكن 
هذه اطراقبة تشمل أيضا الأشياء واممqؤسسات‏ والتعاملات وklؤiاطJ Dodge and Kitchin)‏ 
225 وم يحدث أبدا في السابق أن يتم تكوين مثل هذه الكمية من البيانات عن حياة 
الناس الاقتصادية والاجتماعية بسهولة بالغةء وأن يتم إتاحة هذه البيانات على نطاق واسع 
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للغاية من خلال أسواق السيانات والبنى التحتية للسيانات ومبادرات السانات المفتوحة. 
وف الواقع» فإن اكتساب الوصول إلى البيانات الحساسة ليس مقتصرا على الحكومات 
والشزكات والمتظمات: وذلك تستب أن مراقة التظراء أضبحت أمرا أكثر انتشازا بشكل 
نسبي دون معرفة أو دون الحصول على إذن الشخص الخاضع للمراقبة (716ءز841:0:6 
7.. وبالطبع» كان هذا الأمر متاحاً على الدوام من خلال التطفل والقيل والقال» ولكنه 
أصبح أكثر سهولة في الوقت الحالي من خلال الإنترنت سواءً كان هذا من خلال البحث عن 
السيانات أو شراء تلك البيانات» أو من خلال استعراض سجلات الأجهزة الرقمية كالهواتف 
الخلويةء وبرامج تصفح الإنترنت» أو برامج ال ملاحة بالأقمار الصناعية في السيارات... وغير 
ذلك» أو من خلال وضع أجهزة مراقبة رخيصة نسبيا مثل الكاميرات الدقيقة المصغرة. وكما 
ناقشنا في الفصل الثاني» فإن سماسرة البيانات يسمحون بدراسة تواريخ الأشخاص وذلك 
فيما يتعلق ببعض المسائل مثل الحالة الاجتماعية. والإفلاسء وملكية العقارات» والتاريخ 
الوظيفي» والسجلات الجنائية» والحالة الضريبية» ودعاوى العنف الجنسي أو العنف الأسري, 
والخلفية التعليمية... وغير ذلك. 

ومن ثم فإن طوفان البيانات مكشوف أمام مراقبة البيانات والاستغلالء فمراقبة 
البيانات» تعد أحد أساليب المراقبة التي يتم تفعيلها من خلال فرز وتدقيق مجموعات 
البيانات وذلك بغرض التحديد واطراقبة: والتتبع. والتنظيم» والتنبؤء والتوجيه 
«(Clarke 1988; Raley 2013)‏ وتعمل مراقبة السانات على تحويل الكميات الهائلة 
من الأفعال والأفكار التي تمثلها هذه البيانات إلى صورة واضحة ومقروءة ونماذج 
واضحة للحكم على الأشباء )359 :2004 g9 (Curryet al.‏ مكون أساسي من 
الأشكال الحديثة للحوكمة والحاكمية. وفيما يتعلق باستخدام البيانات» وكما ناقشنا 
في الفصل السابع» يتم استخدام البيانات من أجل توصيف واستهداف الأشخاص 
وذلك بهدف زيادة الأرباح. ومن ثم ففي غالب الأحيان يتم إعادة تحديد الغرض 
من البيانات واستخدامها في أغراض لم تكن مقصودة على الإطلاق عند تكوين هذه 
البيانات» ومن ثم فإن مراقبة الآثار الرقمية والصور التخيلية للبيانات يثيران العديد 
من ال مخاوف الإضافيه وخاصة فيما يتعلق بقضايا مثل الخصوصية. والتنميط والفرز 
الاجتماعي» وإقرار أساليب متعددة للحوكمة. 
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: (Privacy) 4.2o S224! 
الخصوصية هى حالة يتوقعها ويقدرها الكثير من الناس» وهى تعد حقا من حقوق‎ 
الإنسان الأساسية» وهي من الحقوق المقدسة في الكثير من القوانين الوطنية والدولية.‎ 
وق الولايات المتحدة. فإن الخصوصية مغطاة بشكل كبير فى القوانين المسماة قوانين‎ 
الخصوصية: أما في الاتحاد الأوروبي. فهي تقع ضمن نطاقات قوانين حماية البيانات‎ 
وهو‎ olies والخصوصية مصطلح متعدد الأبعاد فيما يتعلق‎ .)Minمآاi‎ et .اه‎ 2013) 
طرق معتمدة على السياق. ولكن على وجه العموم هو‎ à غالب الأحبان‎ à بستخدم‎ 
يشير إلى الممارسات ال مقبوله فيما يتعلق بالوصول إلى والإفصاح عن المعلومات الشخصية‎ 
ومن الوسائل المستخدمه ق إيضاح‎ .)۴1!Wo0d and Leszczynski 2011) والحساسة‎ 
الأبعاد المتعددة للخصوصية دراسة الوسائل العديدة التى يمكن من خلالها انتهاك‎ 
.)10.1 انظر الجدول رقم‎ 501٥۷١ 2006( الخصوصية والأضرار المرتبطة بهذه الانتهاكات»‎ 
فالذي يتضح لنا من خلال هذا التصنيف هو أن انتهاك الخصوصية يمكن أن يكون له‎ 
العديد من التأثيرات على الرفاهية الجسدية والعاطفية للأفراد: وتجعل هؤلاء الأفراد‎ 
عرضة للأنشطة المضرة التي يقوم بها الآخرون: ويجعلهم كذلك عرضة لاختلال توازن‎ 

السلطات غير المتماثل. 

ويوجد بعض الشكوك بأن مفهوم الخصوصية يتغير. وكما تمت الإشارة أعلاهء فإن الناس 
عرضة الآن لمستويات من الفحص والتدقيق وكذلك أساليب المراقبة أكثر من أي وقت مضى. 
فا مهام التي كانت تعد في الماضي خاصة إلى حد كبيرء يتم الان مراقبتها وتسجيلها. على 
Law‏ اطثالء فان البرامج التي كان بشاهدها الشخص على التلفاز $ تكن à dS g po‏ اماضي 
إلا لمن هم حاضرون مع الشخص ذاته في الغرفة ذاتهاء في حين أنه يمكن لشركات التلفاز 
الان مراقبة ما الذي يتم مشاهدته على كل تلفاز على حدة وذلك بسبب استبدال البث 
التلفزيوني وحيد الاتجاه بالتواصل ثنائي الاتجاه. وما يشتريه المرء كان في السابق معروفا 
للعميل والشخص الذي يخدم هذا العميل فحسب والآن أضحت هذه المعلومات التي يتم 
جمعها بشكل روتيني من خلال إدراج النقود الرقمية في عملية الدفع متاحة لشرائح أكبر. 
والأماكن التي كان يسافر إليها الفرد لم تكن سابقا معروفة إلى حد كبير لأي شخص ما عدا 
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المسافرين ومرافقيهم: ولكن في الوقت الراهن أضحى العديد من الأنظمة تكشف موقع 
الشخص والطرق التي اجتازها كنظم الملاحة باستخدام الأقمار الصناعية duill (GPS)‏ 
في السيارات أو أجهزة الهواتف الخلويةء ونظام تثليث الإشارات في أبراج شبكات الهاتف. 
وأنظمة النقل العام التي تعتمد على استخدام شريحة تحديد الهوية باستخدام موجات 
الراديو ((18711) في أنظمة أو أكشاك دفع رسوم المرور. ومثل هذه البيانات التى تنتجها 
هذه الأنظمة يتم إعادة تجميعها ونشرها وبيعها. 


)٠١ - ١( الجدول رقم‎ 


الوصف 





مشاهدة أو الاستماع إلى» أو تسجيل الأنشطة التي 
يقوم بها الشخص 
الأشكال المتعددة من الاستجواب أو التقضي من أجل 
الحصول على المعلومات 
تجميع أجزاء مختلفة من البيانات عن شخص ما 
ربط المعلومات بأشخاص معينين 
الإهمال فى حماية الملعلومات المخزنة من التسريبات 
والوصول i‏ بطريقة غير ملامه 

الاستخدام الثانوي | يتم استخدام ا معلومات التي تم تجميعها لغرض معين 
في أغراض أخرى دون الحصول على موافقة الشخص 











جمع امعلومات Information‏ 


Collection 




















معالجة ال معلومات 


Information Processing‏ موضوع البيانات 


الأستبعاد |الإخفاق فى السماح للشخص موضوع البيانات 
معرفة البيانات التي متلكها الاخرون عنه واطمشاركة 


في معالجة واستخدام هذه البيانات» وهذا يشمل 


الإقصاء واطنع من التمتع بالمقدرة على الوصول إلى 
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الفصل العاشر 


إخلاف الوعد في المحافظة على سرية بيانات 
٠ “|‏ 


انتهاك السرية 


الكشف عن المعلومات عن شخص ما والتي تؤثر في 
الطرق التي يحكم بها الاخرون على شخصيته 
الكشف عن عرىي أو حزن أو الوظائف الجسدية 


الإفصاح 













Wii 






نشر المعلومات "we‏ 
KLUGE‏ زيادة إمكانية | زيادة إمكانية الوصول إلى المعلومات 
Jes! Dissemination‏ 
ابتزاز 
الاستيلاء استخدام هوية الشخص موضوع البيانات من أجل 
خدمة أهداف أو مصالح شخص آخر 
ني 
التطفل الأعمال الانتهاكية التي تزعج هدوء أو انعزال شخص ما 
الانتهاك التدخل المتعلق | التدخل في قرارات الشخص موضوع البيانات التي 
Invasion‏ بالقرارات تتعلق بشئونه Loll‏ 





المصدر: تم تجمیعه من )2006( Solove‏ 

وعلاوة على ذلك فنحن نعيش ف عام أكثر انفتاحا وشفافية بكثير عما اعتدنا عليه سابقا. 
فالمعلومات التى كانت تعد خاصة في السابق يتم مشاركتها الآن بشكل أكثر حرية كالسير 
الذاتية من خلال موقع لينكد إن (1121017): والصور والفيديوهات العائلية من خلال 
مواقع (Flickr) K‏ وإنستجرام (YouTube) $355 (Instagram)‏ والقصص الشخصية 
والعائليه من خلال موقع فيسبوك (001لاءع13) والمدونات: والآفكار والمعتقدات الشخصية 
من خلال تويتر (110161) وغرف الدردشة والتعليقات على الإنترنت. فما كان يتم مشاركته 
في السابق مع عدد لا يتجاوز أصابع اليد الواحدة من الأشخاص كأفراد العائلة. والأصدقاء 
المقربينء وأرباب العمل في المنزل أو المقهى المحلي أو مكتب للموارد البشرية يتم نشره الآن 
على المستوى العالمي مما يسمح لأي شخص بمشاهدته وتعديله (2013 .21 غء (Minelli‏ 
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وعلى الرغم مما ذكر سابقاء لا يتصرف كل شخص بسهولة وبحرية فيما يتعلق ببياناته 
الشخصية» حتى ولو كان الشخص يتصرف على هذا النحوء فإنه لا يتوقع بالضرورة أن هذه 
البيانات سوف يتم انتقاؤهاء ومعالجتهاء وتجميعهاء وبيعها. وهم لا يتوقعون أيضا أن 
تطبيقات البرامج التي لا يوجد بها أي عنصر من عناصر وسائل التواصل الاجتماعي» والتي 
يعتبرونها تطبيقات خاصة رها تقوم بتكوين ونقل البيانات إلى مطوري تلك التطبيقات» أو 
أن بعض الشركات ربما تحاول أن تقوم بالهندسة العكسية لإستراتيجيات حماية الخصوصية 
مثل إخفاء الهوية من أجل إنشاء ملفات شخصية موحدة: ومع ذلك. فإن هذا الأمر 
يحدث بانتظام. على سبيل «JUL‏ وجدت صحيفة وول ستريت جورنال Wall Street)‏ 
[1011) في اختبار أجرى على 101 تطبيق للهواتف là. las 56 of ASII‏ نقلت معرف 
الجهاز المتفرد للهاتف إلى شركات أخرى وذلك دون معرفة المستخدم أو الحصول على 
موافقته» وأن 47 تطبيقا أرسلت موقع الهاتفء» وأن 5 تطبيقات أرسلت البيانات الشخصية 
للمستخدمينء وأن45 تطبيقا لم يكن بها أي ارتباط. مع سياسات حماية الخصوصية التى 
مكن للمستخدمين مشاهدتها (2011 .(Efrati et al.‏ كما وجدت شركة الثقة الإلكترونية 
1A ol (TRUSTe)‏ مقط is duo suas] deba! (slide lxi YYE* cdel vp‏ متاجر 
شركتي أبل وجوجل يشترطان ضرورة اشتمال التطبيقات على هذه Coterill) 4 1.Jl‏ 
1).. ومع ذلكء وكما أشار (2011) 21 ]© 3:2112: يمكن للتطبيقات أن تتتبع وتنقل 
"عاداتك على الشبكة. وأن تبحث في قائمة جهات الاتصال لديكء وآن تجري مكالمات 
هاتفية دون أن تعرفء وأن تتتبع موقعكء. وأن تفحص ملفاتكء وغير ذلك الكثير". 

إن مشهد الخصوصية الآن في حالة تغير مستمرء وهو يخيب كلا من التوقعات القانونية 
والاجتماعية. وبالنسبة للبعضء فإن مفهوم الخصوصية قد تعطل بشكل Rambam) S‏ 
Rubenking 3‏ ;2008). ويرى البعض آنه من الصعوبة مكان المحافظة على الخصوصة 
في التطبيق العملي» كونها تحجب وتخفي تجربة المستخدم» وهي معوق اقتصادي» ولا يبدو 
أن معظم الناس يعارضون آن يتم التنقيب في بياناتهم» وإذا م يكن لديك شيء لتخفيهء فما 
المشكلة في أن يتم معرفه بياناتك؟ (2007 5010e‏ ;126 :2013 رعاه۸). وبالنسبه للبعض 
الآخرء فإن الخصوصية حق يتعين حمايته لأنه من الحقوق التأسيسية ل "المواطنة المطلعة 
والمتأملة" وهو مكون أسامي أيضا لحرية التعبير (2009 2ة14نه::62). وعلى هذاء يُرى أن 
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الخصوصية "سمة ضرورية وتأسيسية للأنظمة السياسية الدمموقراطية المتحررة" (جاعطاه©) 
2. فإذا تم إنكار الأشكال المتعددة من الخصوصية التي تم إيجازها في الجدول 
رقم »)٠١-١(‏ فإن الناس سيكونون عرضة لأنوع مختلفة من الأضرار الشخصية وأشكال 
الحوكمة الأكثر ضررا. ويبدو أن جميع المعلقين يؤيدون وجهة النظر القائلة بأن تشريعات 
الخصوصية م تعد ملائمة للغرض التي شرعت من أجلة: وأنه يتعين تحديث تلك التشرنعات 
لكي تلائم الأوقات التي نعيشها الآن. 

)٠١ -= Y) الجدول رقم‎ 


مىادئ الممارسة العادلة للمعلومات 


الإخطزطار (Notice)‏ يتم إخطار الأفراد بان بياناتهم يتم إنشاؤها ويتم إعلامهم بالغرض 


الذي سيتم استخدام هذه البيانات فيه 
(Choice) Lasy]‏ 
















يتمتع الأفراد بحرية اختيار ا مشاركة أو يؤثرون عدم المشاركة وذلك 
فيما يتعلق ما إذا كانوا يرغبون في استخدام بياناتهم أو الإفصاح 
عنها وكيفية القيام بذلك 


يتم إنشاء البيانات والإفصاح عنها فحسب بعد موافقة الأفراد 
المعنيين 
(Security) jn‏ يتم حماية البيانات من الفقد» وإساءة الاستخدام» والوصول غير 
H1‏ المصرح به والإفصاح عنهاء وتعديلها أو تدميرها. 


التكامل (Integrity)‏ تكون السانات موثوقة ودقيقة وكاملة وحالية 


(Access) Jo g)l‏ يممكن للأفراد الوصول إلى بياناتهم الشخصية والتحقق منها والتثبت 
منها 


(Accountability) aJ«L..Ll‏ | بکون مقتني السيانات نے Vai‏ عن ضمان تحقق المبادئ السابق 








ذكرها وأن يكون لديه الوسائل اللازمة من أجل ضمان الالتزام بهذه 
SL.‏ 





.(Minelli et al. )2013: 156 امصدر:‎ 


۲۹۰ ثورة البيانات البيانات الكبيرة: والبيانات المفتوحة: والبنى التحتية للبيانات» والنتائج ال مترتبة عنها 





AA. 


المكتبة الاقتصادية 

قناة المكتبة على التبليجرام  ECONLIBRARY‏ @ 
المخاوف الأخلاقية, والسياسية:» والاجتماعية: والقانونية 

)١ -— Y) الحدول رقم‎ 


أنواع امعلومات اللحمية 


المعلومات الشخصية ال معرفة | المعلومات الحساسة: هي أي | ا معلومات الأخرى التي يمكن 
(511): هي أي معلومات تعرف 


ERS 


a e 


العنوان البريدي / الرمز البريدى | الآراء السياسية هوية ملف تعريف الارتباط 
(cookie)‏ 


ics che | aai pod sal 
د الاک س ا م‎ 


رقم رخصة القيادة الحالة الاجتماعية / الحياة 


الجنسية 
ooo o owg‏ 


E TS 


المصدر: مقتىس من 159 :2013( .(Minelli et al.‏ 
وفي الوقت الراهنء فإن تشريعات الخصوصية مبنية حول الحقوق الشخصية وا موافقة 
المتعلقة بإنشاءء. واستخدام: والإفصاح عن البيانات الشخصية (2013 501076). وهي تتكون 
من سبعه مبادئ عالميه للخصوصية (156 :2013) .اه e‏ اام (انظر الجدول رقم ۲ - )٠١‏ 
وف إطار هذه المبادئ: فإن الأفراد. من الناحية النظرية» يتم منحهم الحق للتحكم ف بياناتهم 
الشخصية ومنح موافقتهم للاخرين فيما يتعلق بهذه البيانات. وعلاوة على ذلك فإنه يتعين على 
مقتنييى البيانات الالتزام بقوانين حماية البيانات التي تقيد الإفصاح عن ا معلومات الشخصية 

















ثورة البيانات البيانات الكبيرة: والبيانات الممفتوحة» والبنى التحتية للبيانات» والنتائج المترتبة عنها ۲۹۱ 


AZ 


المكتبة الاقتصادية 


قناة المكتبة على التبليجرام  ECONLIBRARY‏ © 





الفصل العاشر 


«(Personally Identiftiable Information- PII) 4-3,‏ وال معلومات الحساسه» والسانات 
الأخرى التي يمكن استخدامها للاستدلال على الشخصية (انظر الجدول رقم ۳-١٠)ء‏ وتؤيد تقليص 
السانات بحبث يقتصر إنشاء السانات على السيانات الضرورية لتحقيق غرض Tene and) (sx‏ 
2 201011]517). وعلى وجه العموم: فإن الحل لاشتراطات ال معلومات الشخصية ال معرفة 
(211) هو استخدام أساليب إخفاء الهوية مثل عدم تحديد الهوية (إخفاء المعلومات الشخصية 
(åd xkl‏ والأسماء المستعارة: والتجميع: بالإضافة إلى التشفيرء والتخزين الآمن: والقيود الخاصة 
بالوصول إلى المعلومات )2011 (Coterill‏ 

وأخيراء تجدر الإشارة إلى وجود العديد من المشاكل الإدراكية والبنيوية المرتبطة 
بتشريعات الخصوصية الحالية. 

وتحاول الدول بصورة روتينية التحايل على قوانين الخصوصية وذلك من أجل أغراض 
الأمن وجمع ال معلومات الاستخباراتية.» بحسب ما تم الكشف عنه iin‏ بواسطهة برامج 
تحليل وجمع البيانات السرية في الولايات المتحدة الأمريكية: وا مملكة المتحدة: والعديد من 
الحكومات الأخرى (انظر الفصل السابع). كما أن الكثير من الشركات لا تشعر بأنها مجبرة 
على تقديم سياسة الخصوصية للأفراد وذلك لأن هذه الشركات تدعي أنها تجمع معلومات 
مجهولة المصدرء ومن ثم فهي لا تقع تحت طائلة ممارسات ال معلومات العادلة. أو ربما 
تقدم هذه الشركات سياسة الخصوصية, وذلك عند الاستهلال الأولي للالتزامات (على سبيل 
«JULI‏ عند تثبيت برنامج ما أو الاشتراك في خدمة ما) وتكون هذه السياسة مصاغة بلغة 
معقدة وغامضة: وعادة ما تشتمل على الاحتفاظ بالحق في تعديل هذه السياسة في وقت 
لاحق دون تشاور إضافي مع الشخص )2013 (Rubinstein‏ 

وفيما يتعلق بالبيانات التي تم تكوينها بدون معرفة الشخصء فمن الصعوبة بمكان 
اكتشاف مثل هذه الممارسات ومواجهتها من الناحية القانونية. أما في حالة الخصوصية 
ذات الإدارة الذاتية. وكما شرح (2013) ©50107, فهى ببساطةه مرهقة للغاية وبالغة 
الصعوبة على الأفراد كونها تتطلب قيامهم بتنظيم خصوصيتهم عبر الكثير من الكيانات. 
والموازنة بين التكاليف وامنافع ال مرتبطة بالموافقة على الشروط والبنود دون معرفة كيف 
سيتم استخدام هذه البيانات في الوقت الحالي وفي المستقبل: وأيضا تقييم التأثيرات الشاملة 
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والتراكمية لبياناتهم التي سيتم دمجها مع مجموعات البيانات الأخرى. وبناء على ذلك 
أشار (2013) 50107 إلى أن: 
(1) الناس لا يقرؤون ساسات الخصوصية؛ (2) إذا قرأ الناس سياسة الخصوصةء 
فإنهم لا يفهمونها؛ (3) إذا قرأ الناس سياسة الخصوصية وفهموهاء فإنهم في الغالب 
يفتقدون الخلفية الكافية لاتخاذ اختيار مبني على المعرفة؛ (4) وإذا قرأ الناس سياسة 
الخصوصية وفهموهاء وكان بإمكانهم اتخاذ اختيار واع ومبني على المعرفة: فإن 
اختيادهم ممكن أن ينحرف وذلك من جراء العديد من الصعوبات المرتبطة باتخاذ 
القرار )1888 :2013 .(Solove‏ 
ومن ثم فإن الموافقة تكون في غالب الأحيان ممارسة عدمة الجدوى Rubenstein)‏ 
i59 (2013: 2‏ عندما يقوم الأفراد عن غير قصد بالتخلي عن الحقوق دون إدراك لمدى أو 
عواقب الفعل الذي يقومون به. ومن ثمء فإن سياسات الخصوصية في غالب الأحيان تخدم 
إخلاء المسئولية للشركات بصورة أكبر مما تخدم عملية ضمان الخصوصية للمستهلكين. 
.(Tens and Polonestky 2012)‏ وعلاوة على ذلك. فمن الواضح أنه في عصر البيانات 
الكبيرة. فإن إستراتيجية إزالة التعرف على الأشخاص توفر شكلا ضعيفا فحسب من أشكال 
الخصوصية لأن من الممكن القيام بالهندسة العكسية للعملية وذلك من خلال التنقيب في 
محموعات السانات .(Narayanan and Shmatikov 2010) lsas255‏ فعلى سسل JULI‏ 
يشرح نيف (Traxc) &L.S15 45 5 (ys (Niv Singer) j2z—4‏ (والمقتبس ف Minelli et‏ 
31 :2013 81) عملية إزالة التعرف على الأشخاص كما يلي: 
يمكن في بعض الأحيان أن يكون من الصعوبة بمكان توحيد الملفات الشخصية 
الاجتماعية المستخدم واحد والذي ربما يستخدم العديد من الأسماء أو تعاملات 
مختلفة في كل واحدة من شبكات التواصل الاجتماعي. ولذا فلقد قمنا ببناء 
خوارزميات تقوم بالتنقيب في العوامل الأساسية التي تشتمل على محتوى 
المشاركات والموقع على سبيل المثال لا الحصرء وذلك من أجل توفير توحيد للهوية 
بشكل فعال إلى درجة كبيرة. 
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ونتيجة لهذه ا مخاوفء يدرس الاتحاد الأوروبي منذ فترة سياسات حماية البيانات (انظر 
المفوضية الأورويuة‏ ;2011 European Commission 2012. Hon et al. 2011; Koops‏ 
11156611123 ). وتشتمل اقتراحات الاتحاد الأوروبي على أن تكون الموافقة صريحة 
ولسست dózis gl diad‏ وأن يكون وصول الأفراد إلى البيانات الخاصة بهم s‏ وشاملا 
وآن يكون للأفراد الحق فى قابلية النقل للبيانات بمعنى المقدرة على نقل البيانات الشخصية 
من مزود خدمة إلى مزود آخرء والحق في أن يتم نسيان الشخصء حيث بمكن للأفراد أن 
يطلبوا حذف بياناتهم إذا م تكن هناك أي أسس مشروعة للاحتفاظ بهذه البيانات: وأن 
تنطبق هذه القواعد أيضا على الشركات خارج الاتحاد الأوروبي إذا كانت هذه الشركات عاملة 
في سوق الاتحاد الأوروبي وتقدم خدماتها "els‏ دول الاتحاد الأوروبي )2012 European‏ 
2-273 وبالمثلء تقدمت مفوضية التجارة الفيدراليه في الولايات المتحدة 
الأمريكية باقتراح يتضمن ثلاثة تعديلات من أجل توفير حماية أكثر فعالية للخصوصية: 
الخصوصية من لال ,التصميم ليث ez‏ تأسيس الخقوصية يشكلا متأصل,في كل مرحلة 
من مراحل تطوير المنتج؛ منح الشركات والمستهلكين خيار مبسط بممنحهم المقدرة على 
اتخاذ القرارات بشأن بياناتهم الخاصة: وهذا يشمل تطبيق آلية لعدم التتبع والحصول على 
الموافقة الصريحة فيما يتعلق بالبيانات الحساسة» أو الحصول على موافقة قبل استخدام 
البيانات في غرض مختلف بشكل مادي عن الغرض الذي تم من أجله تكوين هذه البيانات؛ 
وشفافية أكثر فيما يتعلق بالبيانات وجمعها واستخدامهاء وهذا يشمل الوصول المعقول 
إلى البيانات من قبل هؤلاء الذين تمثلهم تلك البيانات. مع منحهم المقدرة على تصحيح 
أو حذف السانات (مفوضة التجارة الفيدرالىة 2012 (Federal Trade Commission‏ 
وتنشد إستراتيجية الخصوصية من خلال التصميم تطبيق إستراتيجية مختلفة عن الالتزام 
التشريعي والتنظيمي» وهي تقترح أن تكون الخصوصية هي الوضع الافتراضي للعملية؛ 
أي نظام يسعى بفعاليهة وبوضوح إلى ضمان الخصوصية )2009 .(Cavoukian‏ ومن OUS‏ 
المبادئ السبعة المذكورة في الجدول رقم )٠١ - ٤(‏ أن تعزز هذا المنهج. 
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الجدول رقم )٠١ - ٤(‏ 
المبادئ السبعة الأساسية للخصوصية من خلال التصميم 
ا ميدأ الوصف 
ينبغي أن تسعى نظم تكنولوجيا المعلومات لتوقع الخصوصية 
تحديد المخاوف المتعلقة بالخصوصية وتجنبها بدلا من السعي 


الوقايه وليس العلاج 





إلى حل المشاكل الناتجة عن مخالفات الخصوصية بعد حدوتها 
الخصوصية محمية تلقائيا ولا تتطلب أي عمل من جانب الأفراد 
nacti pini‏ 
لأنظمة تقنية المعلومات وليست ميزة إضافية متدنية الأهمية 
الفعالية الكاملة - عائد إيجابي | جميع المصالح والأهداف المشروعة يتم استيعابهاء بدلا من أن 
وليس محصلة صفرية يكون هناك مقايضات بين الخصوصية واعتبارات أخرى مثل الأمن 
الأمن من النهاية للنهاية-حماية | تكون الخصوصية جزءًا لا يتجزأ من النظام من بداية إطلاقه إلى 
كاملة طوال دورة حياة النظام | حين التخلص منه 
الوضوح والشفافية - فلتكن | تكون جميع الأجزاء المكونة للنظام وعملياته واضحة وشفافة 
مفتوحة على الدوام للمستخدمين والشركات الموفرة على السواء وتخضع لتدقيق مستقل 
يجب أن يبنى النظام حول الأفراد» وآن يحمي مصالحهم» وأن 
























احترام خصوصية ال مستخدم - أي 
حعلها تتمحور حول امستخدم 
.(Cavoukian 2009) : ;.La!‏ 





يكون ممکتا لهم 


لقد اقترح العديد من العلماء المتخصصين في الخصوصية وأيضا العديد من مجموعات 
الضغط الصناعية مناهج متعددة لكيفية التعامل مع قضية الخصوصية: فالعلماء 
المختصون بموضوع الخصوصية سبق لهم التطرق للمواضع التالية: الإصلاح التشريعي 
المصمم من أجل حماية حقوق ال مواطنين» والذي يشمل بعض القضايا كالحق في الصفحة 
البيضاءء وتواريخ الانتهاء للبيانات (2011 sمههK).‏ ومن الذي يكون eiua‏ عن ضمان 
الخصوصية: المطورون أم الوكالات آم المستخدمون» وعن الوسائل التقنية والإدارية 
لتنفيذ هذه الأمور (2011 00:6:111©). وما الذي يش كل المعلومات الخاصة وكيفية تأطير 
الخصوصية حول المخاطر ومدى الضرر بدلا من تأطيرها حول تعريف المحتوى Hen)‏ 
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1 216 :»). واقترح هؤلاء العلماء أيضا دخول الأفراد في شراكات مع المطورين حيث 
يكون بإمكانهم أن يختاروا بشكل أكثر استباقية ما البيانات التي يرغبون في نشرهاء 
وللمن تنشر هذه البيانات» وتحت أي ظروف تنشر هذه البيانات. كما اقترحوا أن تتبح 
الشركات للمستخدمين الوصول إلى بياناتهم الشخصية بصيغهة قابلة للاستخدام وذلك من 
Jol‏ مصلحتهم الشخصية. وأخيراء اقترحوا أن تقوم الشركات بمشاركة الثروات الناتجة 
عن تحودل السانات الشخصة Tene and Polonetsky 2012; Rubinstein) Ja J|‏ 
3. وكمثال على هذه المشاركة المفيدة لكلا الطرفين في الثروات المتحصلة من بيع 
بيانات الشبكات الذكية حيث يتم استخدام البيانات التي تم تكوينها من خلال العدادات 
الذكية والمتعلقة باستهلاك أفراد الأسرة للكهرباء من قبل شركة الكهرباء من أجل ضمان 
كفاءة التزويد بالكهرباء» ويتم مع ذلك توفير تطبيقات لأفراد الأسرة لتمكينهم من مراقبة 
استخدامهم الشخصي وأن يعدلوا سلوكياتهم من أجل توفير المال. إن سوق الصناعة: إلى حد 
كبير» يريد إما الاستمرار في الإمدادات الحالية على ما هي عليه أو تقليل هذه الإمدادات» 
مع إدارة الخصوصية من خلال تنظيم يقود السوق ولا يكبح الاستفادة الاقتصادية من 
البيانات. وف هذه الحالة» فمن المتصور آن الشركات سوف تقوم بعملية التنظيم الذاق 
خشية حدوث أضرار بسمعة تلك الشركات أو أن يعبر عملاء الشركات عن عدم رضاهم من 
خلال عدم التعامل مع هذه الشركات إذا انتهكت هذه الشركات خصوصية هؤلاء العملاء 
بڊبشكل مبالغ ذ4 )2013 .(Minelli et al. 2013; Mayer-Schonberger and Cukier‏ 


:(Data Security) SLLJI ġol 
تسيل‎ OLERE مع وضع قيمة البيانات في الاعتبار. وخاصة البيانات الشخصية التي‎ 
سرقة الهوية: أو البيانات التجارية التي يمكن قرصنتها أو استخدامها من أجل تحقيق ميزة‎ 
تنافسية: أصبح أمن البيانات مجالا هاما في حماية البيانات. فالأفراد يمكنهم فتح العديد‎ 
من الحسابات سواءً الحسابات الشخصية أو حسابات العملء مع العديد من الهيئات‎ 
والبائعين وذلك باستخدام العديد من رموز الهوية الشخصية وأسماء المستخدمين وكلمات‎ 
السر. فالبيانات المتعلقة بهؤلاء الأفراد. والبيانات الشخصية الخاصة بهمء يتم تخزينها في‎ 
الكثير من الأماكن (على سبيل المثال أجهزة الحاسب الآلي. والأجهزة الرقمية: والهواتف‎ 
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]158( ومحركات الأقراص الصلبة الخارحية: وأجهزة تخزين السانات المتنقلة مثل‎ aS JUI 
والخوادم. وتكون هذه الحسابات والأجهزة الرقمية عرضة للقرصنة (الدخول على‎ )21© 
الحسابات أو الوصول إلى الأجهزة). والبرمجيات الخبيثة (الرموز التي يتم تثبيتها بشكل‎ 
سري على جهاز الحاسب والتي يمكنها الوصول إلى المعلومات الحساسة أو تسجيل ضغطات‎ 
لوحة ال مفاتيح وترسل هذه الأشياء إلى طرف ثالث). والانتحال (1118طونط2) (الرسائل‎ 
الإلكترونية الاحتيالية أو الهندسة الاجتماعية من خلال ال مكالمات الهاتفية التي تحاول أن‎ 

تجعل الشخص يتطوع بتقديم معلومات حسابه)ء مما يؤدي إلى سرقه واختلاس البيانات. 
وقد ناقش 2011) 1061561 220 6212172) بالتفصل خمسة مستويات لأمن السانات»: 

وكل مستوى من هذه المستويات له محركات مختلفة إلى حد ماء وذلك على الرغم من أن 

جميع هده المستويات تتطلب Ölel >l‏ ع اسشاقية. وهده المستويات تكون على النحو 

التالي: 

)١(‏ الخصوصية: من أجل المحافظة على المعلومات وتقسد تذاولها. 

(۲) الامتثال والالتزام: من أجل حماية البيانات التى من المختمل أن تكون قابلة للكشف 
عند التقاضيء أو الخاضعة لشروط الاستبقاء. 

(Y)‏ الاحتراز: من أجل حماية البيانات التى يمكنها أن تؤدي إلى أو تساعد على سرقة الهوية. 

(E)‏ السرية: من أجل التأكد من حماية ا معلومات السرية مثل الأسرار التجارية. 

(0) التأمينء من أجل حماية ال معلومات عالية السرية مثل الصفقات التجارية: وال ملفات 
الشخصية. والسجلات الطبية» والمعلومات العسكرية: التي يمكن أن يكون لها تأثير 
يتجاوز السرقه الشخصية. 
وتعد إدارة المستوبات الخمسة السابقة لأمن السانات مُهمة بالغة الأهمية بالنسبة للأفراد 

والشركات وامؤسسات. وعلى وجه العموم, يتم انجاز هذه المهمة من خلال التحكم à‏ الوصول 

عبر برامج الأمن وتصميم النظام / الشبكات (على سبيل JULI‏ تثبيت جدار ناريء وبرامج 
الخبيثة): والتشفير الذي يتطلب كلمة سر لفتح الملفات المغلقة. وإذا وضعنا في الاعتبار أنه 
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بمجرد أن يتم الوصول إلى البيانات فسوف يصبح من السهل نسخها ونشرهاء فإن إدارة الحقوق 
الرقمية تسعى لتقييد مثل هذه الممارسات وأن تجعل من السهل أيضا تتبع تلك الممارسات. 

ومع ذلك» وعلى الرغم من هذه التهديدات. فإن الأجهزة الرقمية والخدمات والبيانات: 
ونقاط الضعف ال محتملة في تهيئتهم: تزيد بسرعة أكبر من اللقدرة على تأمينهم Gantz)‏ 
.(and Reinsel 2011‏ $5 حين أن الكثير من أجهزة الحاسس الشخصية وأجهزة الحاسس 
المحمولة آمنة بصورة نسبية مادامت برامج الحماية الخاصة بها تحدّثْ بشكل دوريء 
إلا أن أجهزة الحاسب اللوحية»ء والهواتف الممحمولةء وأجهزة الفاكس» ومحركات الأقراص 
الصلبة الخارجية: والأجهزة الطرفية (مثل الطابعات» وأجهزة المسح الضوئء وآلات تصوير 
المستندات الشبكية): والعدد الهائل من الأجهزة التي تشكل إنترنت الأشياء عادة ما تتمتع 
بحمابية قليلة (2013 .)Rezendes and Stephenson 2013; Rose‏ وقد آدی ذلك ب 
JI (Mims (2013‏ الادعاء بآنه مجرد وجود آي شيء في بيئة تشتمل على رمز رقمي ويتم 
توصيلة بالشبكة. فيمكن قرصنة هذا الشىء من خلال كائنات بحتمل أن يتم التحكم بها 
عن بعدء أو يتم إجبار ذلك الشيء على تجاوز معايير التصميم» أو العمل بطرق غير مريحة 
أو خطرة. أو يضلل المستخدمين مما يؤدي إلى حدوث الأخطاء والأضرار: أو يتجسس على 
الساكنين أو المستخدمين. وعلاوة على ذلكء. فإن الطرق المستخدمة من قبل القراصنة أو 
المعتالين أصحت#أكن تعقيد | وكدوانية عن السكائق أن ضناعة الأن دوما في سباق من 
أجل مواكبة هؤلاء القراصنة وا محتالين )2012 (Goldberg‏ 

فمع تطور ثورة البيانات» ووفرة المزيد من الأجهزة التي تنتج» وتتبادل» وتستخدم 
الباناتء ببدو أن القضايا وال مخاوف الأمنية معرضة للازدياد وليس التقلص Gantz et al.)‏ 
27). وهذا بدوره سيؤدي إلى تفاقم الجرائم مثل ido sal] d$‏ وتقوض الثقة في نظم 
البيانات. ورفع سلسلة من المسائل القانونية المتعلقة بالمسؤولية والالتزامات تجاه حماية 
النظم عندما يتم العبث بالبيانات» واختلاسها وسرقتها (2010 إماW6).‏ 
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Profiling, Social) التشخيصء والتصنيف الاجتماعي والخطوط الحمراء‎ 
: (Sorting and Redlining 

بعيدا عن توسيع محيط المراقبةء وانتهاك الخصوصية: ونقاط الضعف المتعلقة بأمن 
البيانات» تأ المخاوف بشأن ماهية المجالات التي يتم فيها توظيف فيضان البيانات لتحقيق 
أشياء معينة. وكما أشرنا إلى ذلك في الفصل السابع: لم تتغير طبيعة البيانات فحسبء ولكن 
يوجد أيضا تحول نوعي في الكيفية التي يتم بها تحليل البيانات» وفي أي الغايات مكن 
استخدام البيانات وتحليلات البيانات» ومن لديه السلطه لاستخدام واستخلاص القيمة من 
البيانات. فالبيانات كانت تستخدم لوقت طويل من أجل تنميط وتقسيم وإدارة السكانء 
ولكن هذه العمليات أصبحت فى الوقت الراهن أكثر تعقيداء ودقة: وانتشارًاء وانتظاما 
عن ذي قبل بكثير. وني حين أن الهيئات الحكومية تكون ملفات شخضية للأفراد وذلك 
من أجل أغراض الأمن وزصد الاحتيالء إلا أن ga] elis‏ في عملية التنميظايتم من قبل 
الشركات التجارية والتى تسعى إلى فهم واستهداف قاعدة المستهلكين الحالية وامحتملة 
(انظر الفصل الثانى). 

ففي الماضيء. كانت الشركات تقوم بالتسويق الجماعيء ونشر رساله عامه إلى حد ما 
lae SyS de garo hwg‏ من الجمهور وذلك من خلال الإعلان الجماعي باستخدام التلفاز 
والراديوء والطباعة: والبريد الإلكتروني» وذلك من أجل الوضول إلى ا مجموعة المستهدفة 
لتلك (Schwartz and Solove 2011) S6 AI‏ ومرور الوقت. تم تعزيز هذا الأمر 
من خلال التسويق المستهدف وذلك باستخدام التنميط الخام بشكل نسبي. وهناء قامت 
مجموعة صغيرة من الشركات ال متخصصة بتكوين تصنيفات عامة للسكان حيث تم تصنيف 
الأسر إلى أصناف ذات ملفات شخصية عامة. والتي كانت في العادة يتم تسميتها من خلال 
اختيار متغيرات ومواقع dòl Eggo‏ على سبيل امثال باستخدام بيانات الإحصاء السكانىي 
أو البيانات التي تعكس أسلوب الحياة كاستخدام بيانات الاشتراكات في دوريات معينة 
على سبيل امثال (1995 055). وبدلا من محاولة تنميط عملائهم الشخصيينء ترغب 
الشركات في شراء الملفات الشخصية وبانات الاتصال وذلك من أجل تقسيم واستهداف 
أصناف معينة من السكان من خلال رساله مؤطرة بدقهء وق الوقت نفسه تحقيق الفعالية 
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ف ميزانية التسويق من خلال تقليل مصروفات الإعلانات المبددة. وفى الآونة الأخيرة, 
بدأت شركات التنميط في إنشاء ملفات شخصية فردية بدلا من الملفات الشخصية العامة 
وذلك من خلال تجميع البيانات من مصادر عدة مثل معاملات البطاقات الائتمانية 
ومعاملات بطاقات المتاجرء ومسارات النقرء والمشاركات في وسائل التواصل الاجتماعي: 
والعديد من أنواع البيانات الشخصية الأخرى (2013 اءع5168). وعلاوة على ذلك تستفيد 
الشركات ذاتها من الكميات الهائلة من البيانات التى تنشئها عن العملاء على سبيل المثال. 
من خلال المبيعات ومسارات النقر وإدارة علاقات العملاءء وتجميع هذه البيانات مع 
المصادر الأخرى للبيانات وذلك من أجل تكوين الملفات الشخصية الخاصة بهم والاشتراك 
في التسويق السلوى. 

هنا من الناحية الظاهريةء يبدو أن التنميط التنبئي موقف مربح للجميع: للعملاء 
والبائعين» فالعملاء يحصلون على معاملة شخصية ومخصصة. في حين يحصل البائعون على 
مبيعات أكثر ويقللون من النفقات. ولكن وفي المقابلء فإنه يممكن استخدام التنميط التنبئي 
من أجل تصنيف الناس هن الناحية الاجتماعية واستبعاد فئات منهم من خلال اختيار 
أصناف معينة منهم للحصول على وضع تفضيلي وتهميش واستبعاد الاخرين (121212) 
Leyshon and Thrift 9‏ ; 2005). فعلى سبيل اطثالء» مكن للشركة تنميط الناس فيما 
بتعلق مخاطرهم الائتمانيه وما هى احتماليه مقدرتهم على الوقاء بسداد مدفوعاتهم» أو 
فيما يتعلق بقيمة حياتهم المتوقعة إذا ما ظلوا في برنامج الولاء» وما هي احتمالية تغييرهم 
لعاداتهم )2013 .)Minelli et al.‏ ومن خلال استخدام مثل هذه الملفات الشخصة 
dac asl‏ مكن للشركات تحديد الأولويات لاهتماماتهم ومواردهم: وذلك يتم عادة من 
خلال التركيز على العملاء ذوي القيمة العالية. ومن ثم يتم قياس وتصنيف العملاء بشكل 
منتظم ويحصلون على خدمات تفضيلية» وبعضها يكون تمييزيا مثل استبعاد السكان الذين 
يُعَدُون بلا فائدة (لن يحققوا مكاسب للشركة): أو لن يحققوا مكاسب ÄSS‏ أو أن المخاطر 
امرتبطة بهم Us «Ale‏ ممكن أن يؤثر بدوره (Ae‏ الفرص الحياتية Curry 1997; Danna)‏ 
i duara) OL AU e3233 .(and Gandy 2002; Wyly in press‏ منتجات ومكن 
بيعها لشركات أخرى تكون مهتمة في تقييم قيمة ومخاطر العملاء المحتملين» ومن ثم فإن 
النتائج السلبية يمكنها أن تطال الشخص عبر الأماكن وعبر الأزمنة. 
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ومثل هذه الممارسات التمييزية يمكن أن تشتمل على تسعير فعال وشخصيء فمن الأمور 
الشائعة بالفعل في سلاسل المتاجر أن تكون السلعة ذاتها مسعرة بطرق مختلفة عبر المتاجر 
امختلفة وذلك استنادا الى خصائص وسمات السكان الذين يتسوقون من هذه المتاجر: أو 
أن يكون سعر المنتجات مختلفا وفق الكمية المشتراة (مثلا المنتج الواحد بدولار في حين أن 
الثلاثة منتجات بدولارين). أو أن تختلف الأسعار باختلاف الجماعات (مثلا حصول الطلاب 
sl‏ ا مواطنين الكبار قي السن على تخفيضات) (1996 ١ه1اة۷).‏ وتتمتل رغبة الكثير من 
الشركات في تداول مثل هذه الممارسات على أسس فردية» ومعدلة لى تناسب الملفات 
الشخصية. وذلك حتى يدفع أناس مختلفون أسعار مختلفة للمنتج ذاته (كما هي الحال 
مع أسعار تذاكر الطيران ولكن بناءً على نموذج مخصص). وتراوح الأسعار أيضًا بشكل فعال 
ووفق السياق» بناء على الظروف. وقد بدا بالفعل تطبيق مثل هذه الممارسات الشخصية 
وا مرنة» بما في ذلك قطاع المتاجر. فعلى سبيل المثال. تطرق (2012) 0115054 إلى أمثلة تبين 
أن 33s‏ يدفعون في المتجر ذاته أسعار مختلفة للمنتج ذاته وذلك استنادا الى ملف 
العميل الشخصي. وفي بعض الحالات» تقوم المتاجر بتعديل الأسعار وقت تسوق العملاء 
وذلك بناء على موقعهم داخل المتجر وتاريخ التسوق لهؤلاء العملاء حيث يتم منح القسائم 
الإلكترونية في الموقع عندما يقوم المتسوقون بمسح المنتج باستخدام التطبيقات في هواتفهم 
الخلوية. إن الهدف من وراء التسعير الشخصي والفعال هو الحصول على كامل فانض 
القيمة المتاح ف ال معاملة وذلك من خلال تسعير البضائع والخدمات لأقرب سعر ممكن 
من السعر الاحتياطي (سعر التحفظ) لدى الفرذ )17 :2012 «(Tene and Polonetsky‏ 
وبعبارة آخرىء فإن هذا مصمم للاستفادة من الإنفاق JULI‏ لمصلحة المتجر. 

وبالنظر إلى قدرتهم على تشكيل وتصنيف خبرات الل مستهلكين والفرص الحياتية: فإن 
الملفات الشخصية للأفراد والبيانات وممارسات البيانات التى تدعمها بحاجة إلى اهتمام أكبر. 
وف الوقت الحاليء فإن كلا من البيانات المستخدمة والتحليلات المطبقة مبهمة وغامضة 
بالنسبة للمستهلكين والمواطنين» فإذا انتهى الأمر بالشخص مدرجا على قائمة الممنوعين: أو 
تم معاملته بشكل سلبيء أو تم استبعاده من منتج ما من قبل شركة ماء على سبيل المثال تم 
وضعه ف القاثمة السوداء للحصول على الائتمان» فمن الصعوبة يبمكان تحديد الأسس لهذا 
التمبيز ومجابهة هذه الأسباب. فالنقاد يدعون بأننا قد ولجنا فنا Lac‏ 
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رما يتراءى للبعض أن لبنية البيانات أو الصورة التخيلية للبيانات ميزة وجودية» ولكنها 
بالفعل ذات مبزة وحودية. إن ما تقولة بثبة ساناتك عنك أكثر حقيقة وضدقا مما تقوله 
أنت عن نفسك. فبنية البيانات هي البنية التى تم الحكم عليك من خلالها في ال مجتمع: 
وهى البنية التى تماي وتفرض وضعك ق العام» فما نشاهده عند هذه الفترة من الزمن هو 
.(Critical Art Ensemble 1995) 4$.5Jl | Ae Lial áli‏ 

وعلى الرغم من ذلك فنحن نعرف أن البيانات الكبيرة وبنية البيانات فوضويان - فهما 
ممتلئان بالثغرات, والمتناقضات والأخطاء (انظر الفصل التاسع) - ونعرف أيضا أن البرامج 
والخوارزميات تعمل بطرق انتقائية ومتحيزة (2011 100086 210 o3 .(Kitchin‏ 9&« 
فإن الأنظمة التي تعتمد على البيانات الكبيرةء والتي لا تعد شفافة وتفتقد إلى التدقيق 
اللازم وحق الرجوع الملائم» تطرح جميع الأنواع المحتملة من المشاكل وذلك عندما يمنحون 
الأفضليكة لبنية السيانات/ؤفي الواقع. فإن الوقت أصبحيهلاتها الآن أكثريمين:أق.وقت مضى 
للرقابه القانونية والتنظيمية على التنميط التنبئي» وعلى الإجراءات التي تشوش على التمييز 
الوجودي للبيانات وتحمي الناس من الممارسات التمييزية والضارة. 


Secondary Uses,) ةيقlبتسالا الاستخدامات الثانوية والتحكم في الانسلال والحوكمة‎ 
(Control Creep and Anticipatory Governance 

إن أحد الأسس التي تستند إليها سياسة الخصوصية وحماية البيانات في الاتحاد الأوروبي 
وأمريكا الشمالية هو مفهوم تقليص البيانات. وهذا المفهوم يشترط أن تقوم الهيئات 
والبائتعون بإيجاد البيانات الضرورية فحسب لأداء مهمة ماء بمعنى أن يتم الاحتفاظ 
بالنيانات طاما كان ذلك ضروريا لأداء هذة اللهمة أو كما تملية الاعتبارات القانونية؛ وأن 
البيانات التي يتم تكوينها يتعبن استخدامها فحسب من أجل هذه المهمة Tene and)‏ 
o2 uis .(Polonetsky 2012‏ لا يتعين على جامعي السانات أن يستولوا على أي شيء 
يمكنهم الاستيلاء عليه؛ ولا يتعين عليهم كذلك تخزين هذه البيانات لمدة غير محدودة أو 
أن يتيحوا هذه البيانات لاستخدامات ثانوية. ومن الواضح أن هذه التطلعات والطموحات 
تتعارض مع المبادئ والأسس المنطقية للبيانات الكبيرة وعمل أسواق البيانات التي تسعى إلى 
تكديس البيانات في حال كان من الممكن أن تكتسب هذه البيانات أي قيمة في ا مستقبل؛ 
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J2J8 .(Tene and Polonetsky 2012; Andrejevic 2013)‏ أمام البائعين تمثل في إعادة 
تقديم البيانات من خلال إزالة الآجزاء التي تشير لهوية الأفراد من هذه البيانات أو إنشاء 
diris Ollo‏ مع إخضاع مجموعة البيانات الأساسية فقط لعملية تقليص البيانات. ويمكن 
في هذه الحالة بيع البيانات ال معاد تقدهها أو استخدامها بعدة طرق» ومثل هذا الأسلوب 
لإعادة تحديد الغرض من البيانات أمر شائع» حيث يجادل البائعون أنه لا توجد حاجة 
لإبلاغ الشخص الذي تشير إليه البيانات أو الحصول على موافقته» حيث إن هذه البيانات 
مجهولة ال مصدرء ومشتقة ومجمعة (2007 50107). وهذا الحصاد المحتمل OUS‏ 
الهائلة من البيانات» والذي تم الحصول على معظمه دون معرفة أو فهم الأشخاصء والذي 
يتم استخدامه بعد ذلك في استخدامات ثانوية» يثير الكثير من الأسثلة الأخلاقية التي لا 
تتعلق بالخصوصية وحماية البيانات فحسب» بل تتعلق كذلك بالحوكمة» ومن الأمثلة 
الواضحة وام متعلقة بالحوكمة هو التحكم فى الانسلال. 

إن التحكم في الانسلال يحدث عندما تكون البيانات التي تم إنشاؤها لشكل من أشكال 
الحوكمة مشابه لشكل آخر (2001 65م1). وحدث هذا غالبا بشكل شديد الوضوح فيما 
يتعلق بالأمن وخصوصا بعد أحداث الحادي عشر من سبتمبر» حيث تم إعادة توظيف 
البيانات الخاصة بخطوط الطيران والبيانات الإدارية الحكومية من أجل تنميط وتقييم 
مخاطر الأمن للركاب (ط2003 deg (Lyon‏ نحو مشابهء فلقد تم إعادة توظيف كاميرات 
الإشارات المرورية ورسوم الازدحام في لندن من أجل القيام بمهام تتعلق بالأمن: وذلك بدلا 
من مراقبة الانتهاكات المرورية فحسب (20072 .(Dodge and Kitchin‏ ومن الأمثلة 
التجارية على التحكم في الانسلال هو نظام الملاحة في السيارات المستأجرة حيث يتم إعادة 
توظيف هذا النظام من مساعدة السائقين على إيجاد طريقهم فحسب إلى مراقبه وفرض 
غرامة على هؤلاء الذين يقودون خارج ال مسار أو يخرجون من الولاية )2004 (Elliott‏ 
فالتحكم في الانسلال يقوض بشكل منهجي الأسباب المنطقية وراء تقليص البيانات» في حين 
أن نشره يشكل تهديدات واضحة للحريات المدنية» حيث يكون جميع المواطنين» سواء 
الأبرياء أو المذنبين» خاضعنن لطراقبته وإجراءاته التأديبية. 
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وهناك مثال آخر على الاستخدام الثانوي للبيانات والذي ينتهك الحريات المدنية آلا 
وهو الحوكمة الاستباقية (التوقعية). وهناء يتم استخدام التحليلات التنبئية من أجل 
تقييم السلوكيات أو الأحداث المستقبلية المحتملة والتوجيه باتخاذ الإجراء المناسب. فمثل 
Ree A23 dz e] daSeodl 6s‏ فن قاق الف الو اال غد مق" السبتوات. 
حيث يتم تنميط المسافرين من أجل المخاطر والتحقق الأمني وذلك قبل البدء في الرحلة 
.)(0dge and Kitchin 2004)‏ وباط مثل» تستخدم العديد من قوات الشرطة ق الولايات 
المتحدة الأمريكية التحليلات التنبئية من أجل توقع موقع الجرائم المستقبلية أو من أجل 
توجيه ضباط الشرطة لزيادة دورياتهم في هذه المناطق (2013 1ءعء51). وعلى النحو ذاتهء 
تستخدم بعض الشركات مثل هيوليت باكارد (1>210ء22 116171»66) التحليلات التنبئيه من 
أجل تقييم ومعرفة مَّن من الموظفين من المحتمل أن يغادر الشركة» ومن ثم التدخل بشكل 
استباقي من أجل تقليل نفقات استبدال الموظفين (2013 اء5168). وفي مثل هذه الحالات. 
فإن آثار البيانات الخاصة بالشخص تقوم بما هو أكثر من تتبع الأشخاصء إذ تقوم باستباق 
هؤلاء الأشخاص (2002 ۲ء [ه†S).‏ 

إن مثل هذه الأساليب من الحوكمة تفرض قضاياً أخلاقية بسبب أنها توجه الاهتمام 
إلى مجموعات وأماكن معينةء وهي كذلك تسعى لطراقبة السلوكيات التي رها لن تحدث 
على الإطلاق. وخلال هذه العملية: كما تقوم بإعادة تشكيل كيف Sce‏ للناس العمل من 
خلال الانضباط الذاق (2006 6:دامء:113). وعلاوة على ذلك: فإن مثل هذه التحليلات 
التنبئية تعمل في غالب الأحيان على تفاقم التحامل والتمييزء وتعمل كذلك على تأسيس 
النبوءات ال محققة لذاتها (التوجه نحو إشباع الذIٽ(‏ )2013 „(Harcourt 2006; Siegel‏ 
ومن ثم فلقد ادعى 128 :2013) عاه۸): "إن البيانات في هذا المجال تكون أدائية: فتجميع 
OLLI o (bits) Slug elza‏ $ ملفات شخصية ممشتبه به ف الإرهاب» وإعادة تأسيس 
البيانات المجردة عند استهداف حياة واقعية سوف يكون لهما تأثير على إنتاج هذه الحياة 
هذا الشخصء كمشتبه به بالإرهاب بالفعل". ومن ثم يتم وضع الفرد تحت بؤرة المراقبة 
وممارسات مراقبة الدولة. وجعله خاضعا لنتائج وتداعيات كونه مشتبها به بالإرهاب» على 
الرغم من عدم التبقن من هذا الاشتاه. وبعمارة أخرى: تتم معاملة الشخص بطريقة 
مختلفة من جراء التوقع بأنه رما يكون شيئاً ماء في حين أنه ربما يُكن هذا الشيء أو 
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لايكنه آو ريما يرتكب هذا الفعل أو لا يرتكبه. وفي حين أن النوايا وراء هذا العمل 
رما تكون نوايا عظيمة وحسنة: إلا أن التوقع في هذه الحالة له تداعيات تتجاوز منع 
الأحداث .(Harcourt 2006) 4x32‏ وكما هو الحال مع الأشكال الأخرى من التنميط: 
فإن الحوكمة التنبئية يتم توجيهها بشكل كبير من خلال خوارزميات الصندوق الأسود التي 
تعمل على بيانات ذات أصل غير معروف» وهي على وجه العموم منغلقة على حق الرجوع 
(النقد). فالحوكمة التنبئية كانت مثار القليل للغاية من الاهتمام النقدى أو المناقشات 
وذلك ها يتعلق بتأثيراتهاء وعلى الرغم من ذلك تم تطويرها بفعالية من أجل استخدامها 
في الحكومات والشركات. 


Modes of Governance and) أساليب الحوكمة والضوابط التقنية‎ 
: (Technological Lock-Ins 

بعيدا عن التحكم في الانسلال والتنميط التنبئيء فإن ثورة البيانات لها تأثيرات محتملة 
فيما يتعلق بتنظيم وتشغيل الحوكمة. وإذا وضعنا في الاعتبار الشبكة المتسعة لجمع 
البيانات» وقراراتها الدقيقة» فإن قلق الكثير من المعلقين ينبع من أن عصر ظهور البيانات 
الكبيرة يسبق عصر ظهور ما أصطلح على تسميته وصاية الأخ الأكبر (:عط]غه:8 ع81). وهذا 
يعني أننا في عصر أضحت فيه الدولة والمؤسسات.تعرف وتتوقع الكثير جدا عن الأفراد من 
خلال مراقبة البيانات والتنميط التنبئي لدرجة أنهم يمتلكون السلطة لفرض أشكال قاسية 
وضارة من التحكم الانضباطي. 

وكما أشرنا إلى ذلك خلال هذا الفصلء فنحن نعيش وبدون شك في عصر المراقبة الزائدة 
بشكل مبالغ فيه حيث أصبحت المراقبة أكثر اتصالا من أي وقت مضىء وهى مدعومة من 
خلال تزايد ثقافة السيطرة التى ترغب في الأمنء والاستقرار وتقليل (Lyon 2007) jlolz.L!‏ 
وهناء يتم تشريع نوع جديد من الحوكمة. وهو نوع يؤول فيه تنظيم جوانب معينة 
من الحماة البومية إلى الأنظمة التقنية المملوءة بالتوكيل الثانوى Kitchin and Dodge)‏ 
1)). فعلى سبيل المثال. فإن معرفة. ومعالجة وإدارة الانتهاكات المرورية تتم بشكل 
متزايد من خلال الأنظمة الآلية: والمسموح بها من خلال برنامج يقوم بمعالجة البيانات التى 
تتعلق بأرقام اللوحات: والسرعة. وحق الوصولء وإحالة هذه البيانات إلى قواعد بيانات 
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املكية من أجل فرض غرامات أو خصم نقاط بشكل „(Dodge and Kitchin 2007a) JI‏ 
وعلى النقيض من الأشكال التقليدية من المراقبة التى تسعى إلى تشجيع الانضباط الذاق؛ 
فإن الأنظمة الالية تقوم بإعادة تشكيل السلوك بشكل Agre 1994; Kitchin and) Jel‏ 
.(Dodge 2011‏ وق مثل هذه الآنظمة. فإن آليات إنشاء البيانات وتنظيمها تعتير مجالا 
مهما للغاية من النظام: وذلك بدلا من كونها جزءا خارجا عن النظام. فعلى سبيل المثالء 
بدلا من أن يقوم عمال صناديق المحاسبة بإجراء الانضباط الذاق يلعدل عملهم لأنهم رها 
أو رمالا يعرفون أنه تتم مراقبتهم من خلال كاميرات المراقبة التلفزيونية ذات الدائرة 
ا مغلقة» فإن عمل مسح البضائع ومعالجة المدفوعات هى الوسائل التي يتم من خلالها 
مراقبة معدل العمل بشكل مستمر. وف مثل هذه الأنظمة/ فإن المراقبة وآثار البيانات 
المرتبطة بهذه المراقبة أصبحت مستمرة: ومتغلغلة. ومواظبة: ومتفاعلةء مع سلوك الخاضع 
لهاء ولکتها تقع خارج (Cohen 2012) 4h‏ 

إن البيانات التي تكونت بشكل آلي لا يستخدم جميعها من أجل تشريع الإدارة الآلية, 
ولكن هذا هو الاتجاه السائد بشكل متزايد» وخاصة للأنظمة عالية التنظيم. وعلاوة على 
eUS‏ فإن الأسالس الجديدة من التحكم. إلى الان» لا يتم السماح بها بالطريقة الصارمة 
التي توقعتها رؤية جورج أورويل 45s) (3 (George Orwell)‏ "الأخ الأكبر", فهذه 
الأساليب عادية وروتينية ومغرية وتشجع ال مواطنين على أن يشاركوا بفعالية وبتلقائية 
3( ممlرlaolw‏ )2012 ET (Kitchin and Dodge 2011; Cohen‏ لذلكء فانه وكما 
ذكر )2007( Solovo‏ فإن البيانات الكبيرة لا تتعلق بشكل كبير بمباشرة رؤية جورج 
أورويل ولكنها ترتبط بشكل أكبر برؤية كافكا (12312) كونها تطرح قضايا عن الإجراءات 
الواجب اتخاذها فيما يتعلق باللامبالاة,» الأخطاءء الانتهاكات؛ الإحباط. نقص الشفافية, 
والاستعانة أكثر مما تطرحه عن التسلط والاستبداد. وعلى النقيض من ذلكء فبالنسبة للا 
قاله (2013) 806115]08: فإن المجاز الأساسي فى البيانات الكبيرة والمراقبة ليس الرؤية 
الكليةء ولكن بالأحرى هو التسليم» فبدلاً من أن يكون الفرد خاضعاً على نحو صرف لرقابة 
انتهاكية» يسلم الناس بحماس ببياناتهم من خلال وسائل التواصل الاجتماعيء أو من خلال 
الانضمام في برامج بطاقات الولاء... إلخ. وبغض النظر عن الصياغة التصورية للعملية: 
فمن الواضح أن هذه الأنظمة الجديدة لها تأثيرات فيما يتعلق بالسلطة والسيطرة: وتقوم 
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بتشكيل التجارب والفرص الحياتية بطريقة مختلفةء وأن دور البيانات ومراقبة البيانات في 
مغل هذه الأنظمة يتطلب اهتماماً نقدياً إضافاً 


إن من الطرق التي يتم من خلالها تحويل الحوكمة من قبل التقنيات التي تدعمها 
البيانات أن نجعل الحوكمة أكثر تكنوقراطية بطبيعتها (معتمدة على التقنية بشكل كلي). 
فعلى سبيل المثالء فإن النزعة تجاه إدارة وتنظيم المدن من خلال أنظمة ال معلومات 
والأنظمة التحليلية تعزز الأسلوب التكنوقراطي للحوكمة المدنية التي تفترض أنه من 
الممكن قياس ومراقبة جميع المجالات المدينة ومعاملة هذه المجالات على أنها مشاكل فنية 
مک التعامل معها ومجابهتها من خلال الحلول الفنية (2014 «نطاء)1>آ1)» وهي توضح ما 
أطلق عليه (2013) 113666112 مصطلح "العقلانية الأدائية". وما أطلق Morozov) ade‏ 
3) "مقاربة الحلول التقنية" حيث ممكن تجزئة المواقف الاجتماعية المعقدة إلى مشاكل 
محددة بشكل دقيق تمكن حلها أو البحث عن أفضل الحلول لها من خلال الحوسبة. 
ومرة أخرئ: فإن هذا يعد تجسيدا للبيانات الكبيرة حيث هكنها أن توفر إجابات لجميع 
.(Mattern 2013) J$L‏ ومن خلال التقاط وتمثيل الظواهر كبيانات بشكل آني أو 
لحظيء يصبح من الممكن من الناحية الظاهرية تخطيطء وفهم» وإدارةء وإصلاح الموقف 
أو المشكلة حال حدوثها. وقد أوضح )2013( Hill‏ أن "تفكير المدينة الذكية" ينم عن 
وجهة نظر تكنوقراظية بأن المدينة هي شيء يتعين علينا فهمه بالتفصيل كالمحرك أو 
محطة الطاقة النووية وذلك ف حال كان لدينا بيانات كافية فقط. وأنه تبعا لذلك سيمكننا 
السيطرة على هذه المدينة من خلال القوة الغاشمة للعلم والهندسة. وفي الواقع» فقد اقترح 
Matte” )2013(‏ آن تحضر البيانات الكبيرة يعاني من تراكم البيانات» وهو افتراض أن جميع 
التدفقات والأنشطة الهادفة ممكن الإحساس بها وقياسها. وداخل مثل هذا التفكير هناك 
افتراض واضح في الغالب وهو أن الكون تشكل من قبل المعايير القابلة للمعرفة والقابلة 
للتحديد والتي تؤكد لنا أنه لو كان بإمكاننا قياس جميع هذه المعايير. فسوف نكون قادرين 
على التنبؤ والاستجابة بتمكن تام وفقا (Haque 2012) WY‏ وعلى الرغم من ذلك لن 
يكون بمقدور الحلول التقنية بذاتها حل المشاكل الهيكلية المتأصلة في المدن لأن هذه الحلول 
لا تتعامل مع أسباب تأصل تلك المشاكل. ولكن بدلا من ذلك فإن هذه الحلول تمكن فقط 
من إدارة مظاهر تلك المشاكل بشكل أكثر فعالية. وفي حين أن تقنيات المدن الذكية مثل 
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أسالي التحليل اللحظية والآنية يتم الدفع بها كوصفة للتعامل مع جميع قضايا الحوكمة 
المدنية: إلا أن هذه التقنيات في الغالب الأعم تداري الشقوق بدلا من إصلاحهاء إلا إذا 
واكب هذه التقنيات مجموعة أخرى من السياسات )2014 e9 (Kitchin‏ أن ينطبق 
الأمر نفسه على الطرق التكنوقراطية المطبقة في بعض المجالات الأخرىء. فأساليب الحوكمة 
التي تقودها البيانات تضمن بالفعل تنفيذ إستراتيجيات مدعومة بالأسانيد ولكن يجب أن 
تكون مقترنة بالسياقء ومرنةء ومستهدفة بشكل ملائمء ولا يتم إدارتها ببساطة من خلال 
الأرقام والخوارزميات. 
ويتزامن مع ذلك الانتقاد القائل أن الحوكمة أصبحت مبنية على معرفة تامة وتكنوقراطية 
مفرطة ومع الخوف من أن يتم الاستيلاء عليها وتشكيلها بشكل صريح من قبل مصالح 
الشركات من أجل تحقيق مكاسب شخصية. وبالعودة إلى المثال المتعلق ببرنامج المدينة 
الذكية ومثال الحوكمة البلدية» وكما أشرنا إلى ذلك في الفضل السابع: فإن عددا من أكبر 
شركات خدمات البرامج والأجهزة يسعى بشكل فعال إلى التعاقد من الباظن غلى مجالات 
من الإدارة المدنية وأن تجعل من بضاعتهم جزءًا لا يتجزأ وذات دور جوَهري في كيفية 
مراقبة وتنظيم العديد من مجالات الحياة ق اممدينة )2013 (Kitchin 2014; 1ownsend‏ 
إن الهاجس والقلق النابع من خصخصة الإدارة المدنية 53 (Kitchin 2014) 4&3] 3X5‏ 
« أولا: أنه يعزز بشكل فعال الاقتصاد السياسي للليبرالية الجديدة والتحول نحو اقتصاد 
السوق في القطاع العام حيث يتم إدارة وظائف المدينة من أجل تحقيق الربح 
.(Hollands 2008) „oll‏ 
٠‏ ثانيً: أنه يؤسس للقيد التقني الذي يجعل المدن مدينة وممنونة بالفضل لمنصات ومزودي 
خدمات تقنية معينة خلال مدة زمنية طويلة» مما يخلق مواقف احتكارية (2013 11111). 
والخطر في هذه الحالة يكمن في تأسيس تبعية للمسار المؤسسي مما لا يمكن إلغاؤه أو 
التحول عنة بسهولة (2012 82665). 
ه ثالثا: أنه يؤدي إلى حلول مغلفة أساسها "نظام واحد مناسب لجميع المدن الذكية" والتى 
لا تضع في اعتبارها إلا بشكل ضثيل للغاية خصوصية وتفرد الأماكنء والناسء والثقافات. 
وتقيد إدارة المدينة على أسلوب تكنوقراطي ذي رؤية ضيقة للحوكمة (2013 10152520 ). 
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وإذا ما أستحضرنا الواقع, فإن شركة IBM‏ الوقت الحا منتجا يسمى "مركز عمليات 
4 الذي" الذي يجمع العديد من الأنظمة التي تم تصميمها لمدينة ريو دي جانيرو في 
منتج واحد يمكن تطبيقه على أي 453 Singer 2012c)‏ انظر الفصل السابع). ولا يعنى 
هذا أن نقول إن القيود التي تفرضها الشركات أمر حتميء: ولكن من الواضح أن ذلك يمثل 
رغبة عدد من آکر الشركات العاملة قي هذا المجال. bbg‏ يتم اذاف اکال e‏ 
من الحوكمة بشكل متزايد من خلال الشركات التي تسعى إلى إيجاد أسواق للحلول التقنية. 
ومرة أخرىء فإن تداعيات مثل هذه الأشكال من الحوكمة تتطلي الكثير من التدقيق. 


الخاتمة: 

ناقش هذا الفصل التداعيات الأخلاقية: والاجتماعية. والسياسية» والقانونية للتغييرات 
التى تحدث من جراء تكوين البيانات ودمج البيانات واستخدام البيانات.. ومن الواضح 
أنه في حين أن مثل هذه الممارسات لها فوائد بالنسبة للحكومات والشركات وال مواطنين. 
إلا أنها في الوقت نفسه لها تداعيات سلبية وتمييزية. وإذا وضعنا في الاعتبار السرعة التى 
يتغير بها مشهد السانات: فإن مواكبة التطورات وتحديد الآثار المحتملة لهذه التطورات» 
ودراسة ردود الفعل الاجتماعية والقانونية المناسبة يعتبر تحديًا هائلا. وفي الواقع هناك 
الكثير من الأسئلة الأساسية المعيارية التي تتطلب دراسة تأملية والتي تتعلق من مكنه 
تكوين مجموعات البيانات والوصول إليها ومشاركتها وتحليلهاء ولأي غرض وفي أي سياق 
وتحت أي معوقات أو قود (673 :2012 and €raw ford‏ 0ydهb).‏ إن الحاجة إلى إجابات 
لمثل هذه الأسئلة أمر ملح. وذلك إذا وضعنا ف الاعتبار المدى والتأثيرات المترتبة على 
مراقبة البيانات وانتهاك الخصوصية والأمن غير ال محكم للبيانات: والتأثيرات الضارة للفرز 
الاجتماعي والاستبعاد. والطبيعة والأساليب المتغيرة للحوكمة. فحتى لو كانت الاستجابة 
سريعة ومبالغ فيهاء فإن الإجابات المترتبة ستكون متنوعة: حيث إن العديد من أصحاب 
المصلحة يسعون وراء إستراتيجيات بديلة من أجل التعامل مع المخاوف العديدة. بحسب ما 
يتضح من خلال المناهج المقترحة لتفتت وانتهاكات الخصوصية. ونتيجة لذلك؛ يمكن للمرء 
أن يتوقع الكثير من المناقشات في السنوات القادمة فيما يتعلق بإدارة العناصر العديدة 
في ثورة البيانات. وعلى وجه الخصوص. وكما ناقشنا في الفصل الثاني. فإنه من ا محتمل أن 
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يوضع عمل سماسرة البيانات تحت التدقيق المتزايد سواء من جانب الحكومة أو المواطنين. 

j9làie (99‏ 3651" « من المهم للغاية أن يضطلع العلماء بدور فاعل في استقصاء ودراسة 
القضايا القانونية والسياسية والاجتماعية والأخلاقية التي تنشأ نتيجة لثورة البيانات» مع 
التتبع والإسهام في المناقشات العديدة المستمرة. يحتاج مثل هذا العمل إلى أن يشتمل من 
جانب على دراسات حالة تجريبية مفصلة توثق التأثرات ال مادية والاستطرادية الناتجة عن 
كيفية توظيف البيانات» ومن جانب آخر على البحوث والرسائل à us‏ والشاملة التي 
تحدد تأثيرات تجميع العديد من البيانات والطرق البديلة الممكنة. وحتى هذه اللحظة 
فإن معظم الإسهامات كهذا الفصل والأعمال التي يناقشها تكونت من الجانب الأخير مع 
فحوة القليل ys TA‏ الدزاسنات e duo yo!‏ عيض الآنظمة اللمتباعنة القدرة السددة 
ونتائج هذه الدراسات. إن مثل هذه الدراسات مهمة للغاية لآنها تكشف الطرق ال ملموسة 
التي تم من خلالها تقديم مبررات لتجميع البيانات» وكذلك المهام التي يتم ممارستها وكيف 
يتم قبولهاء وإعادة تنقيحهاء ومقاومتهاء وإفسادهاء وانتهاكها من قبل المجتمعات» وهذه 
الدراسات توفر أيضا قاعدة أدلة يتم من خلالها تصور كيف هكن إعادة تأطير Jis‏ هذه 
الأنظمة أو إعادة تحديد الغرض منها. 
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(Making Sense of the Data Revolution) 


ناقش هذا الكتاب قضية أنه يتعين أن تكون هناك حاجة إلى تعاط أكثر نقدية وفلسفية 
مع البيانات وأن ثورة البيانات ما زالت قائمة في الوقت الراهن. وفيما يتعلق بالأمر الأول 
ادعى البعض أن البيانات تمثل عناصر أساسية لإنتاج المعرفة. ومع ذلكء فحتى الوقت 
الراهن م تحظ الصياغة الوجودية للبيانات والمجاميع ا محيطة بإنتاج البيانات واستخدامها 
بالاهتمام الكافي. وبدلاً من ذلك فإن التركيز كان منهجيا بصورة أكبر فيما يتعلق بتكوين 
البيانات: أو أن التركيز كان على الأشكال الاشتقاقية للمعلومات والمعارف: وفيما يتعلق 
بالأمر الثاني: ادعى البعض أن تدرج البيانات الصغيرة في البنى التحتية للبيانات وإتاحة 
الوصول للبيانات التي كان الوصول إليها محدودا في السابق. وظاهرة البيانات الكبيرة 
تدمر الابتكارات ولا تدعمها أو تحافظ عليهاء فهي تغير طبيعة البيانات من حيث حجم 
هذه البيانات» وسرعتهاء وشموليتهاء وعلاتقيتها ودلاليتها. ومرونتها وتوسعهاء وتنوعهاء 
وانفتاحها وتبادليتهاء وهى السبب في ظهور مجاميع بيانات جديدة وطرق جديدة لفهم 
العام الذي نعيش فيه. إن التأثيرات التدميرية لثورة البيانات لها تداعيات هائلة على 
الحكومات والشركات والمجتمع المدني وذلك من خلال إنشائها لمعارف وممارسات جديدة 
يمكن استخدامها من أجل إعادة صياغة كيف يمكن أن يتم حكم الناسء: وكيف يمكن أن 
تتم إدارة المنظمات» وكيف هكن أن تتم زيادة القيمة والفائدةء وكيف هكن أن يتم تكوين 
رأس المالء وكيف يكن أن يتم تحسين الأماكنء وكيق يكن أن تتم إعادة تخطيط وممارسة 
العلم. وهي أيضا أثارت العديد من التحديات وطرحت الكثير من الأسئلة» ومكنت لوسائل 
أكثر شيوعا فيما يتعلق بمراقبة البيانات» وتقويض الخصوصية: وتنميط الأشخاص والأماكن 
والفرز الاجتماعي» ومهدت لسن أشكال جديدة من الحوكمة. فهذا الفصل الأخير يحدد 
خطة طريق دلالية من أجل إدراك وفهم البيانات وثورة البيانات وذلك بالنظر إلى الفجوات 
الحالية في الفكر المفاهيمي والمعرفة. ويشير هذا الفصل إلى أن مثل هذا الفهم بحاجة 
إلى أن يحدث بطريقتين: الأولى» من خلال التفكير الفلسفي الشامل والتحليل النقدي 
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الفصل الحادي عشر 


والمفاهيمي. والثانية. من خلال البحوث التجريبية المفصلة التي تتعلق بأصلء وتشكيلء 
ووظيفية وتطور مجاميع البيانات. 


فهم السسانات وثورة السانات :(Understanding Data and the Data Revolution)‏ 
إذا وضعنا في الاعتبار فائدة وقيمة البيانات» فهناك حاجة ملحة للنظر إليهم من وجهة 
النظر الفلسفية وا مفاهيمية. فالفلسفة. كما ادعى )1921( eel |, Wittgenstein‏ 
ا منطقي للفكرء. فكل مدرسة من مدارس الفكر lal; Ax‏ للأفكار a‏ لفهم العاط. 
وممصطلح عام. تتشكل كل مدرسة وتختلف عن المدارس الأخرى من خلال أربعة مكونات 
-الوجودية (3ع1240108©).: وال معرفية (Ideology) & 3..Vls (Epistemology)‏ 
(Methodology) 4 2s‏ - وهذه المكونات هي التي تحدد معاييرها. فالوجودية هي 
مجموعة من المعتقدات التي تتعلق بطبيعة الوجود» وهي تهتم ها هو موجود وما كن 
ملاحظته ومعرّقته. وبالنسبّة للبيانات, فالوجودية تتعلق ماهيطةآألبيانات. ما الطبيعة 
الأساسية للبيانات؟ أما ال معرفية فهي تتعلق بكيفية استخلاص المعرفة أو الوصول إليهاء 
وهى الافتراضات عن كيف هكننا معرفة العام معنى كيف أصبح بإمكاننا معرفة البيانات؟ 
وهي أيضا تتعلق بكيفية حشد البيانات في ممارسة التعلم. أما الأيدلوجية فهي تتعلق 
بالسياسات الضمنية والغرض من إنتاج المعرفة: والمدى الذي يسعى من خلاله المنهج لي 
يكون محايدا بمعنى أن يكون موضوعيًا وغير تقويميء أو المدى الذي يسعى من خلاله 
المنهج بفعالية للتدخل وتغيير العالم. وحيث ذلك. ينطوي تحت مفهوم الأيدولوجية العديد 
من الأسئلة مثل هل البيانات سابقة للحقيقة؟ وهل هي سابقة للتحليل وبلاغية؟ أو هل 
السانات el ds lul‏ سياسية؟ وهل تهت صياغة هذه السانات بفعالية؟ أما المنهجية 
فهي مجموعة الإجراءات المستخدمة من أجل تفعيل سؤال أو نظرية ضمن الافتراضات 
الوجودية أو المعرفية للفلسفة الإجمالية للبحث. وهي تشكل اختيار الأساليب التي يتم 
من خلالها تكوين وتحليل البيانات: فالمنهجية والأساليب مرتبطان بشكل وثيق» ولكن ما 
طبيعة هذه العلاقة سنهما؟ 
لقد شرع الفصل الأول في تقديم إجابات أولية عن هذه الأسئلة وقدم أيضا صياغة لفهم 
البيانات من منظور فلسفي مكن من فصل هذه البيانات عن كونها مجرد "مواد خاء' 
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للمعلومات والمعارف. فالبعض ادعى أن السانات اجتماعية ومادية: وآن السانات لا تمثل 
العام فحسب» ولكنها تنتج هذا العام بشكل فعال. وادعى البعض أيضا أن البيانات لا توجد 
بشكل مستقل عن الأفكارء والأساليب» والتقنيات» والناس» والسياقات التي تنتج» وتعالج 
وتديرء وتحللء وتخزن هذه البيانات. وق الواقع» يتم تنظيم البيانات وتخزينها قي قواعد 
البيانات والبنى التحتية للبيانات التي تشكل لب المجاميع الاجتماعية الفنية المعقدة. وكما 
تم الإشارة إليه بالتفصيل في الفصل الأول. تشتمل هذه الأنظمة على أنظمة الفكرء وأشكال 
المعرفة» والتمويل: والاقتصاد السياسيء وأنماط الحاكمية. والتشريعات. والماديات» والبنى 
التحتة: والممارسات. وال منظمات والمؤسسات. والذاتيات وال مجتمعات: والأماكن والأسواق»: 
وكل نظام من هذه الأنظمة يشتمل على polis‏ عديدة (انظر الجدول " - .)١‏ فهذه 
العناصر تعمل سويا بطرق متعددة: واتفاقية وارتباطية وذلك من أجل الإنتاج الاستطرادي 
واطادي لمجاميع البيانات (انظر الشكل " - .)١‏ لقد تم عبر هذا الكتاب مناقشة العديد من 
هذه ال مجاميع مثل البنى التحتية البحثية: وا لمحفوظات الوطنية» والبنى التحتية السيبرانية: 
ومشروعات البيانات المفتوحة» وسماسرة البيانات» وأنظمة السانات الحكومية» وأنظمة 
الأعمال. وكل واحدة من هذه ال مجاميعء بالرغم من أنها تتشارك في قواسم مشتركة. إلا أنها 
تتطور وتعمل بطرق مختلفةء وهي تتكون من مجموعة من الأنظمة والعناصر التي تتوسع 
بشكل مختلف (على سبيل ys JULI‏ المنظمات. والماديات المحلية. إلى الفرق المنتشرة. 
والقوانين الوطنية. وفوق الوطنية إلى الأسواق العالمية) ولكنها على الرغم من ذلك مرتبطة 
داخل كوكبة فريدة. 

إن مثل هذه الصياغة تمكننا من جهة من التفكير في إنتاج البيانات وكيف يمكن صياغة 
هذه البيانات بأشكال متعددة من النواحي الفنية: والسياسية» والاقتصادية؛ والأخلاقية. 
«lS Ll‏ والزمانية.» وصياغة استخدامات هذه البيانات والعمل الذي تقوم به في العام 
وتمكننا من الجهة الأخرى. من توجيه البحوث التجريبية التي تتعلق بمجاميع البيانات 
(انظر الجزء التالي). وهيء على الرغم من EUS‏ مجرد مجموعة واحدة من الطرق ال محتملة 
لفهم البيانات» ومما لا شك فيه أنه بمرور الوقت سيتمكن العلماء من إنتاج مجموعة 
من المناظير التي يمكننا من خلالها فهم البيانات. إن تنوع وجهات النظر سوف يؤسس 
لعناصر تكميلية مثمرة للأفكار الجديدة ووجهات النظر المفاهيمية من أجل توجيه البحوث 
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التجريبية. وربما تشتمل هذه على تنظير البيانات من خلال منظار تأسيسي (بنيوي) أكبر 
يركز على دور هذه البيانات في تشغيل الرأسمالية المتأخرة: أو يستفيد من مفاهيم ما بعد 
البنيوية لدولوز (أحد أهم الفلاسفة الفرنسيين في النصف الثاني من القرن العشرين) التى 
تتعلق بأساليب الحوكمة الجذمورية (الجذمور: مفاهيم تتوزع على شبكة. بحيث تلتقر 
مع بعضها دون اشتراط اللزوم)ء أو الانتقادات النسائية ما بعد الاستعمار للنوع الاجتماعي 
والإنتاج المسَيّس وتوظيف البيانات. وبغض النظر عن ا منظورء فالمطلوب هو تفكير عميق. 
وحريص ونقدي مع تنظير العمل من خلال دراسات الحالة التجريبية. 

As loo استكشاف الصباغات المفاهيمية للبيانات فحسب» ولكننا‎ I ds loo UJ Ul 
كما ناقشنا في الفصل الثامنء إلى دراسة كيف تطرح ثورة البيانات بعض التحديات أمام‎ 
الفلسفات الحالية للعلوم. فالبيانات الكبيرة وتحليلات البيانات توفرء على وجه الخصوص.‎ 


بالاستكشافية بطبيعته وذلك من أجل تطوير النظرية العلمية: فالمحاولات الأولية للتفكير 
فيما يمكن أن يعنيه مثل هذا التحول النموذجي كانت في غالب الأحيان مرتبكة ومضللة 
وتعزز شكلا من أشكال التجريبية التي يجدها الكثير من العلماء إبعادية وخطوة إلى الخلف 
وليست خطوة إلى الأمام. ويتعين استبدال هذا بمنظور أكثر فعالية لما يمكن أن يتكون 
منه العلم المساق بالبيانات من حيث معتقداتة الفلسفية والمنهجية. لقد بدأ مثل هذا 
التفكير بالكاد. ومع ذلك فهناك حاجة ملحة إليه من أجل مواكبة إيقاع التغير التقني ونشر 
المنهجيات المخصصة والبراجماتية (الواقعية): وكذلك من أجل استتبدال الأشكال التجرسية 
الضعيفة المنتشرة. فالتحول النموذجي أقل احتمالية في العلوم الإنسانية والاجتماعية» ولكن 
على الرغم من البيانات الكبيرة» فإن البيانات ا مفتوحة والبنى التحتية للبيانات توفر منهجيات 
وطرق جديدة للقضايا الاجتماعية» والثقافيةء والسياسية» والاقتصادية» والتاريخية. فالفصل 
الثامن استعرض خطة تفصيلية بالمزايا والانتقادات النسبية المتعلقة بالعلوم الإنسانية 
الرقمية والعلوم الاجتماعية الحسابية التي يتم تطويرهاء ولكن هناك حاجة ملحة لمناقشات 
كاملة وصريحة من شأنها استخراج النتائج من التحول المعرفي في الفكر والممارسة. ويجب أن 
تقوم مثل هذه المناقشات أيضا بتقييم دور ومزايا دراسات البيانات الصغيرة, وكذلك المناهج 
الهجينة التى تمزج أساليب ووسائل البيانات الصغيرة والبيانات الكبيرة. 
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ومثل هذا التفكير يجب أن يواكبه تفكير آخرء موجه بشكل أكبر تجاه المعيارية» في 
تكوين واستخدامات البيانات» وإنشاء وتشغيل مجاميع البيانات. وكما ناقشنا في الفصل 
العاشرء تطرح ثورة البيانات عددا من القضايا الشائكة وذلك فيما يتعلق بالمدى الذي يتم 
على أساسه التقاط الحياة اليومية في مجاميع البيانات» وكيف أن بنية البيانات للناس تفوق 
وتضع قيودا على حياتهم بجميع أنواع الطرق غير المتوقعة. فعلى سبيل «JULI‏ هل يجب 
أن يتحلى الناس بالمقدرة على الوصول إلى جميع البيانات المتعلقة بهم: وأن يكون لديهم 
الحق في تصحيح والاعتراض على هذه البيانات: أو تحليلات البيانات أو التنميط؟ وإلى أي 
مدى يجب أن يكون الناس قادرين على ممارسة الحق في أن يتم نسيانهم؟ وما هي الطرق 
التي يمكن من خلالها إخضاع سماسرة البيانات لرقابة وتنظيم مستقلين» وخاصة عندما 
تكون بياناتهم وخوارزمياتهم تؤثر في الفرص الحياتية للناس؟ وما هو مدى تأمين الأنواع 
ا مختلفة من البيانات ؟ وما العقوبات المحتملة على انتهاكات هذا التأمين؟ وما الحدود 
المشروعة للحكومات في تجميع ودمج البيانات عن مواطني هذه الحكومات؟ وإلى أي مدى 
مكن إشراك المؤسسات في أعمال الحكومات وأنظمة الحوكمة؟ فهذه القضايا تتعلق بماهية 
المجتمع المرغوب فيه في عصر وفرة البيانات: والإجابات عن هذه الأسئلة لها تداعيات 
وخاصة فيما يتعلق بإمكانية إعادة تصور وإعادة تهيئة مجاميع Jais liag OLLI‏ 
الأشكال الجديدة من الحوكمة والتنظيم. فالعلماء القانونيون بدئوا بالفعل في التفكير في 
بعض القضايا مثل نتائج خصوصية البيانات الكبيرة. وبدؤوا كذلك في تقديم طرق بديلة 
للتعامل مع أكثر الآثار ضرراء ولكن من الواضح أن مثل هذه القضايا بعيدة كل البعد عن 
الحل؛ وأنها ستكون محل تركيز ال مناقشات المتطورة والصراعات التشريعية» وأن هناك حاجة 
ملحة للإسهام في هذا الحوار الفعال والصريح والمستمر. 

ويتزامن مع تطوير فهم مفاهيمي ومعياري أعمق وأفضل للبيانات» الحاجة إلى توفير 
وجهات نظر شاملة نقدية وكلية عن البنى التحتية للبيانات والسانات ا مفتوحة والسيانات 
الكبيرة وتداعياتهم. لقد قدم هذا الكتاب تحليلا شاملا بدلا من طرح فرضية تستند إلى 
بحث تجريبي شاملء واستفاد من الكتابات الأكاديمية والإعلامية والصناعية. فهذا النهج ذو 
فائدة لأنه يجمع الأفكار والملاحظات سويا من مصادر متعددة وذلك من أجل تقديم نظرة 
أعم وأشمل عن المشهد المنتشرء مما يساعد على رسم وتصور الديناميكيات الأكبرء ودراسة 
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التأخير ات المحتملة لها. ومع ذلك وعلى الرغم مما سبقء فإن المنظور العام الصعب. 
والتأمليء والشامل لثورة البيانات لا يزال ضعيفا في الواقع العملى. وبدلا من ذلكء فهناك 
مجموعة من الكتب وعلى وجه الخصوص في مجالات الإدارةء والأعمالء والمجالات التقنية 
تعمل بشكل كبير على دعم البيانات ولكنها تفتقر للمنظور النقدي. وعلى النقيض من 
ذلك» فالمطلوب تقارير متعددة الاختصاصات ومعقدة في تفكيرها. وفي حين أنه من المفيد 
دراسة ثورة السانات من خلال منظور متعدد الاختصاصات والأوجه: إلا أن هذا المنظور 
مقيد بشكل جذري وذلك بالنظر إلى الأجندة الشاملة والآثار المترتبة. وعلى نحو مشابه»ء فإن 
المفهوم القائل بأن ثورة البيانات تنتج البيانات التي يمكن تفسيرها خارج سياقها أو المعارف 
خارج مجالها االمخصص بحاجة إلى أن يتم إلغاؤه. ودلا من ذلك» فمن الضرورى الاستفادة 
من الأفكار والمدازك غير الإاختضاضات: حيث يعمل العلماء الذين نتمتعون دخيرات ممختلفة 
Jel 52 kin‏ تقديم صورة أكثر شمولا خو )2012 (Ruppert‏ 
وعلاوة على ما سسبق» فإن التحليلات أوجدت حاجة لكي نكون حريصين ألا ننزلق إلى 
الجدليات التافهة التي إما تحدد بشكل انفعاليٍ حالة البيانات الكبيرة: والسانات المفتوحة: 
والبنى التحتية للبيانات» أو توفر Ja;‏ مستحكما يشجب أكثر نتائجها Mala‏ فاملوقف لا 
يكون TT Ls]‏ أو Jas.‏ أو عدا أو da‏ إلا فيما ندرء وعلى النحو الذى تطرحه الجدليات 
الانفعالية. ودلا من ذلك» يتعين Ule‏ أن نقر بأن التطورات الحادثة اتفاقية: وارتباطية: 
وسياقية» وهي تنتشر بطرق فوضوية وأحبانا تناقضية وتباينية. وكما أشرنا إلى ذلك في 
الفصل التاسع» تعمل مجاميع البيانات في الغالب على كل من الإجبار والتحرير بشكل 
Gr‏ ومتزامنء وأن مستهلي البيانات أحمانا يكونون هم منتجي السانات» وآن الأنظمة 
تسعى إلى استنطاق المستخدمين بطرق عديدة. وعلى هذا النحوء فإن المجاميع غالبا ما 
تكون متشابكة ويتعين أن يتم فتحها وتفريغها بشكل حذر وذلك من أجل إظهار تدرجاتها 
الرمادية المتعددة. وعندما توجد تأثيرات تعمل بطرق مضرة وتمييزية» فنحن بحاجة إلى 
تحديد الاستجابات الاجتماعية والقانونيه المناسبه التى تحمي الحقوق الفردية والجماعية؛ 
ولكنها لا ترفض الكل لعدم رضاها عن الجزء. 
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دراسة :(Researching Data Assemblages) ٽlilııll zaolas‏ 
هناك ضرورة ملحة لإجراء بحوث تجريبيه مفصلة عن تكون» وعملء وتعزيز مجاميع 
البيانات وذلك من أجل مواكبة وتعزيز التحليلات النقدية والمفاهيمية الأعم والأشمل. ففي 
الوقت الحاليء لدينا فهم متعمق قليل بكل من البناء الإجمالي لمجاميع البيانات وأجهزتها 
وعناصرها الفردية. ونتيجة bib ILa U‏ ملحة لإجراء دراسات حاله تتتبع الترتيبات 
الفنية الاجتماعية لكافة المجاميع» مثل تجميعة بيانات لسمسار ما أو البنية التحترة لبيانات 
بحث ماء أو حركة البيانات المفتوحة في مدينة ماء أو التوثيق المفصل للجالات معينة من 
A]‏ ا مجاميع: مثل علم الاجتماعء والاقتصاد السياسي مطوري (Hackathons) cL ;JI‏ 
ومنتديات العطل الأسبوعية لمجموعات الاختصاص (1(15765 10368): أو مجتمعات الممارسة 
داخل قطاع ما في البيانات الكبيرة. وبشكل نموذجيء فإن مثل هذه الدراسات ستكون 
دراسات مقارنة بطبيعتهاء تقارن التكرارات في تجميعة ماء على سبيل المثال: عبر الأماكن أو 
البيئاتة أويعبر أنواء اختلفة مناالتجميعة. ومن sso Jie Lo‏ المقارنة:هنذه أن تمكن 
من تحديد العموميات والخصوصيات: وكذلك الطرق الاتفاقية والارتباطية المتنوعة التي 

تتسع من خلالها التجميعة ليتم تشكيلها 

وهناك طرق عديدة ممكن من خلالها تفعيل مثل هذه البحوث؛: وهي تشمل تحليلا 

البیانات» كما تمت مناقشته فى الفصل السادسء وذلك من أجل تحديد تركيب تجميعة 
ما والارتباطات والعلاقات بين العناصر. وسيكون مثل هذا النهج فوائد عديدة وذلك من 
خلال استخدام قوة التنقيب عن البيانات والتعلم الآلي من أجل تحديد الأنماط داخل وعبر 
مجاميع كبيرة Tantum‏ وكذلك من أجل تأسيس قوة نسية للروابط. وهذا من شأنه أن 
يوفر ا اا leg‏ للمجاميع وتشغيل هذه ال مجاميع. وعلى الرغم من ذلكء وفيما 
يتعلق بفهم السياقء والاتفاقية والارتباطية المتعلقة بتجميعة ما -التداخل ال معقد للكائن 
ومحيطه - فإنه من المحتملء ربما بشكل ساخرء أن مجموعة من المنهجيات الخاصة بالبيانات 
الصغيرة قد توفر تبصرا إدراكياً تنويريا دقيقاً. وتشتمل هذه المنهجيات: على سبيل المثال 
لا الحصء على منهج علم الأصول (Genealogies)‏ ومنهج (Deconstruction) dL!‏ 
ومنهج الأعر اقى Observant) J&-2MLl 4$) LZ es (Ethnographies) LUI‏ 
21+ وهي تمثل مجموعة من المنهجيات التى أبدت استخدامها في السابق 
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Dodge et al. 2009;) J452:Jls .(Kitchin and Dodge 2011) z4l;J! e$ Jl 52‏ 
.(Kitchin et al. 2012 a‏ وتسعى كل منهجية إلى أن تحدد وتفكك بشكل دقيق الظواهر 
الاجتماعية: وكما بينت العناصر الأحد عشرء فإن مجاميع البيانات تعتبر اجتماعية بشكل 
كلي. ومن خلال استخدامها كمجموعة: فإن الإنتاج المادي والاستطرادي المنتشر ملجاميع 
البيانات يمكن تجزثته لأغراض علمية: مما يوفر ما أطلق عليه (2013) 11758 مصطلح 
"البيانات الكثيفة": أي الأفكار والقصص السياقية عن البيانات وإنتاج البيانات. 

ان علم الأصول يستخدم RS‏ من أجل RS‏ الانتشار العرضي لنظام الأفكار أو de garh‏ 
من الأفعال عبر الأوقات والأزمانء وذلك بدلا من إنتاج تأريخ غا Crowley) eL‏ 
9).. وهذا يوضح كيف أن المستقبل يبنى على الماضيء ولكنه لا يتحدد بالضرورة من 
خلاله بطرق سببية مسببيه بسيطة. وعلى هذا النحوء يتم توظيف علم الأصول من أجل 
الحل والقهم بشكل تاريخي للتكرارات المتناقضة والمتغايرة أحياناء وا معقدةء وا متعددة 
لأحد مجاميع البيانات, أو أحد غناصرها وكذلك الفهم للانتشار المتطور والقائم للأفكار 
والقرارات» والمعوقات. والأفعالء واللاعبين الذين أسهموا ف تطور هذه المجاميع جنبا إلى 
جنب مع النهايات المسدودة والإخفاقات الواضحة (1977 1016هء1010). US Je weg‏ 
فإن هذا يحدد نقاط التجمع حيث يحتشد الناس أو الأفكار سويا ويتسببون فى ظهور 
مجاميع جديدة: وكذلك الطرق ال معقدة والفوضوية التي تتطور من خلالها هذه المجاميع 
بعد ذلك. وف حال ثورة البيانات, يمكن توظيف منهج علم الأصول من أجل تتبع تكوين 
وتطور البيانات المفتوحة والبنى التحتية للبيانات والبيانات الكبيرة بشكل أكثر عمومية, 
والتحسيد ال محدد لها. 

فعلى سبيل المثال. يمكن لشخص ما أن ينتج تأصيلا مفصلا لتطور حركة البيانات المفتوحة 
بتعبيرات عامة. من خلال تتبع ظهور اللاعبينء وا منظمات. ونماذج التمويلء والأفكار 
والأحداث بمرور الوقت وعبر الزمن: والترابطات والتحالفات والخلافات بينهم» وتأثيراتهم 
على إعادة تشكيل مشهد السانات من خلال إعادة تحديد السياسات التى تحيط بالحكومة 
الت أنتجت» واحتفظت» وكشفت مثل هذه البيانات من أجل استخدامات أعم وأشمل. أو 
يمكن للشخص أن يشرع في تحديد أصل كيان فردي مثل مؤسسة اللعرفة المفتوحة» وهي 
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مؤسسة غير ربحية تأسست ف العام 2004 في المملكة ام متحدةء ونمت بسرعة لي تصبح 
حركة دولية مؤثرة تطالب بالبيانات المفتوحة والحكومة ا مفتوحة. وهناء يمكن أن يسعى 
الفرد تجاه تتبع نشأة المنظمة: وتطور مهمتها وقيمها. وتطور البنى التحتية» والحوكمة: 
والتمويلء والأنشطةء والبرامج والإصدارات» وانتشار تأثيرها وتفاعلاتها مع الهيئات الأخرى 
وهكذاء وذلك من أجل فهم الطريقة الاتفاقية والارتباطية لتوسعها وعملها على سبيل 
«JULI‏ وكذلك موقعها الحالي وسلطتها ضمن حركة البيانات المفتوحة الآعم. 

إن إجراء تحليل علم الأصول عادة ما يصاحبه الاستفادة من التفكيك» وهذه الطريقة من 
التحليل تجرد وتكشف ا معاني داخل النصوص ال مفهومة بشكل واسع مثل النصوص ال مكتوبة؛ 
والصورء hól adlg‏ والأحاديث»: ومزيج من هذه الأشياء تشكل ف العادة المحتوى للكتيبات 
والمواقع الإلكترونية. فمن المفهوم أن النصوص هي الوسيط لكل من الرسائل الصريحة 
والضمنية» ومن خلال التفسير التشريحي للنص» مكن فهم والكشف عن معان أعمق. ومن 
ناحية الجوهرء فإن التفكيك يبحث فيما يتجاوز الإشارات السطحية والقيم الاسمية لي 
يواجه القراءات المسلم بها للنص وذلك من أجل الكشف عن ال معاني المخفية بداخله» أو ربط 
امعاني المبسطة MacLure 2005; Harley 1989) Sos JS Zo‏ 220 :1811111131). فالتفكيك 
هو قراءة نقدية تستخدم أساليب مثل استبدال ا معاني أو القوة المحتملة: أو تحديد نقاط 
التناقض أو التباين لأجل حل النصية البينية والتضمين داخل الماديات والسياقات الأع 
والتفكير في وضعية المتحدث والجمهور المستهدف (Burman and MacLure 2005) 4J‏ 
وكما أشرنا إلى ذلك بالتفصيل في الفصول الثاني والثالث والسابعء فإن البيانات المفتوحة 
والبقى التحفبة للنناناة والتناكات الكيزة غادة مانمواكننا حمسا أنقلدة خطابة تب عن 
إلى إقناع الناس» والشركات» والمؤسسات منطقها من أجل دعم وتبني والاستثمار في مبادئها 
ومنتجاتها. فالأنظمة الخطابية هذه ليست عالمية ولكنها معقدة وفوضويةء فهي مزيج من 
المصالح المتعاونة والمتنافسة. ومن خلال استخدام التفكيكء فإن الأنظمة الخطابية لتجميعة 
ماأو عناصر معينة في هذه التجميعة. مثل الفئات العديدة في حركة البيانات ال مفتوحة أو 
شركات معينة تعمل على تعزيز حلول البيانات الكبيرة على القضايا المدنية» يممكن تجريدها 
وتفكيك رسالتها وتكوينهاء مما يكشف عن المعاني» والأيدولوجيات (المعتقدات): والسلطات 
الكامنة داخل تصميمها وعرضها. 
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وتوفر دراسات الأعراق والثقافات تحليلات شاملة وهائلة لمجتمعات الممارسة من 
خلال التوثيق التفصيلي لتنظيمهاء وعملهاء وثقافتهاء وقواها المحركة الداخلية وارتباطاتها 
الخارجية (2000 116116). وعلى نحو نموذجيء يوظف ال منهج الإثنوغراقي (وصف 
الأعراق والثقافات) مزيجا من مراقبة المشاركين التي يتم القيام بها عبر فترة زمنية ممتدة 
ومقابلات شخصية متعمقة مع مجموعة كبيرة من المستفيدين الداخليين والخارجيين» مع 
تعزيز كل ما سبق بأسالي أخرى مثل القراءات التفسيرية للوثائق والأدوات ذات الصلة 
مثل المواقع الإلكترونية: وتبادلات البريد الإلكتروني. وأماكن العمل... إلخ. ومن الناحية 
الجوهرية. يسعى علم دراسة الأعراق والثقافات إلى الفهم الدقيق للعام الحياتي ملجتمع 
ما - علاقاته الاجتماعيةء وايقاعاته المتواترة. ومعانيه الثقافة: وأنماط السلطة: واتخاذ 
القرار فيه» وطرق كينونته.... إلخ - من أجل فهم كيف تشكل هذا المجتمع وكيف ينمو 
Cook 2007) 1s. JS 25‏ 3110 13118)). ويذهب الباحث lal aa Jost‏ تقديم 
وصف سطحي تتوثيق الطرق ال معقدة التى تعمل من خلالها المجتمعات من خلال كونها 
متضمنة داخل العلاقات والممارسات التي يتم دراستها. ومن شأن دراسة الأعراق والثقافات 
مجاميع البيانات أن تق بعد ذلك أوصافا تفصيلية اقل عن كيف تم تكوينها وكيف 
تعمل على أرض الواقع. فعلى سبيل JELI‏ فإن دراسة الأعراق والثقافات لمؤسسة ال معرفة 
المفتوحة سوف تتكون من باحث تم تضمينه داخل تلك ال منظمة. وهو يشارك في التخطيط 
للاجتماعات: والأنشطة. والفعالياتء. ويراقب تفاعلات العمال ويجري مقابلات شخصية 
مع المستفيدين الأساسيين للحصول على مدارك مباشرة حول عمليات اللاعبون الأساسيون 
في حركة البيانات المفتوحة: وكيف يتم تأسيس وإدارة المكونات العديدة لمجاميع البيانات 
(بمعنى أنظمة الأفكار؛ والاقتصاد السياسي؛ وأنماط الحاكمية؛ والماديات؟ والبنى التحتية؛ 
إلخ) داخلها وعبرها. وعلى نحو مشابه: يمكن للفرد أن يجري دراسة الأعراق والثقافات 
داخل بنية تحتية معينة للبيانات» أو على سمسار للبيانات» آو داخل SII OLL åS è‏ 
أو داخل أنواع معينة من الفعاليات مثل سباقات البرمجة أو المعارض واممؤتمرات الصناعية 
أو فرق البيانات الكبيرة داخل الحملات الانتخابية... إلخ. 

ويمكن أن يتم دعم مثل هذه الدارسات للأعراق والثقافات من خلال مشاركة 
الملاحظ. وهذا نوع من الدراسة الذاتية للأعراق والثقافات حيث يجرى الباحث 
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دراسة مستديهة لارتباطاتهم وارتباطات الناس الآخرين بظاهرة أو ممارسة ما 
and Cook 2007; Morton 2005)‏ 1:35 )). وفيما يتعلق بثورة السانات:» من 
الممكن أن يتم مشاركة الملاحظين بحيث يكونون جزءا من فريق يبني البنى التحتية 
للبيانات» أو يكونون أعضاء فى حركة البيانات المفتوحة» أو يعملون كعلماء للبيانات 
يوظفون البيانات الكبيرة من أجل معالجة قضية معينة... إلخ. فتوظيف مثل هذا 
النهج يعتبر في الأصل تمرينا للانعكاس الذاتي. وهو تدريب شخصي وغير موضوعي» 
حيث يسعى الباحث lialo‏ وبدقة بالغة لدراسة ممارساته وممارسات الاخرين 
في مجال ما حيث يكون Ley‏ ا à‏ هذا المجالء فالفائدة الأساسية لمثل هذا 
المنهج تتمثل في أن الباحث يدرك بشكل كامل المشهد المتنوع وا معقد من النواحي 
الاجتماعية. والسياسية. والاقتصادية والذي يعمل من خلاله هذا الباحث ويعتبر 
أحد المشاركين الفاعلين فيه ويتعرض للعمليات المتعددة الجارية. ويظل الانتقاد 
الأساسي الموجه للثل هذا المنهج هو أنه من الممكن بدرجة كبيرة أن ينثني الباحث 
ويوضع في مكان ما بشكل شخصيء مما يفقده التمثيل العريضء وربمما تتم الاستفادة 
من هذا ال منهج بشكل أمثل إذا ما تم دمجه مع طرق أخرى توفر سياقا أعم وأشمل. 

إن هذه الطرق تمثل مجموعة جزنئيه من مجموعه من الطرق ال محتمله لفهم مجاميع 
البيانات وعناصر هذه المجاميع. ومما لا شك فيه أن الكثير من هذه المناهج سوف يتم 
توظيفها من أجل إجراء بحوث تجريبية على طبيعة ثورة البيانات المنتشرة: إذ يوفر كل 
Ol alil da. Aline coo qe‏ اام از وعم خا ج sh) ad god‏ 
السياقية المتعمقة للدراسات النوعية التي تستهدف البيانات الصغيرة وبين الدارسات الأعم 
الى توظف تحليلات البيانات رها يكون سبيلا مفيدا لاتباعه. وف مثل هذه الدراسة؛ 
من الممكن استخدام تحليلات البيانات من أجل تقديم منظور شامل لمجاميع البيانات» أو 
الروابط أو التداخلات بين المجاميع: والتى يتم اتباعها بعد ذلك من خلال البحوث الأكثر 
تركيزاً باستخدام الطرق التي تم تفصيلها من أجل توفير رؤى متعمقة للعلاقات والعمليات 
السارية ذاخل وبين هذة العناضر. أو من الممكن أن يكون هذا المزيج مزيجا كميا صرفا 
فيما يتعلق بالصيغة» وذلك على النحو الذي تمت الإشارة إليه بالتفصيل فى المناقشات بشأن 
علم البيانات في الفصل الثامن» حيث تم تبني التحليل التفسيري لتجميعة البيانات بشكل 
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الفصل الحادي عشر 


أكبر من اختبار الفرضيات التقليدي من أجل تحديد أكثر العناصر الفاعلة ظهورا. ويمكن 
أن يعمل هذا المنهج أيضا بشكل عكسيء حيث يتم استخدام البحوث المتعمقة المركزة من 
أجل توجيه انتشار تحليلات البيانات عبر عينة أكبر بكثير. وفي كلتا الحالتين» فإن ال مرحلتين 
الأولى والثانية تعملان بتناغم بعضهما | مع بعض من أجل تعزيز المدارك وا معارف. ففي 
الحالة الأولى» يتم استخدام الصورة الأعم من أجل المساعدة في صياغة الفهم وتعميقه وقرنه 
بالسياقء أما في الحالة الثانية. فإن الفهم المتعمق يوفر الأساس لمحاولة تأسيس أو وضع 
تفسير أعم وأشمل. 


آفکار ختامىة: 

لا تزال ثورة البيانات فى طورها التمهيديء» ولكنها تنتشر بسرعة بالغةء فخلال عدد 
من السنوات Y‏ يتجاوؤز أصابع اليد الواحدة: كان للبيانات المفتوحة والبيانات الكبيرة 
والبنى التحتية للبيانات تأثيرات كبيرة على مشهد البيانات. وتزامن هذا مع مناقشات 
صوتية حماسية تعلن عن التأثيرات الإيجابية الخطيرة لها. إن سرعة التطورات التى تحدث 
تعني أن التحليل النقدي الموسع والمتعمقء والمدروس يجد صعوبة بالغة في مواكبة تلك 
التطورات. ومما لا شك فيه أنه خلال السنوات القليلة القادمة سيكون هناك فيضان 
حقيقي من مثل هذه الدراسات التي تسعى إلى توثيق طبيعة وآثار مجاميع البيانات 
الناشئة. وكما ادعى البعض خلال هذا الفصلء فهناك حاجة ملحة لهذه الدراسات. إن 
هذا العمل سوف يحدد من جانب الطرق ال مناسبة لفهم ثورة البيانات: من خلال كل 
من التفكير المفاهيمي والدراسات النقدية. وعلى الجانب الآخرء سيوفر بيئة لتفكير أكثر 
معيارية فيما يتعلق بكيفية تطور وتنظيم وإدارة مشهد البيانات. وق الوقت الراهنء فإن 
i d ossa ae‏ فاليا ورتا عا duci end‏ عليه Apes gal‏ 
لقد سعى هذا الكتاب إلى تقديم تحليل أولي ومفاهيمي بشكل متوازن» ونقدي وشامل 
والذي من الممكن أن يساعد على توجيه الدارسات التي تتبعه. ولوقت طويل للغاية 
فإن البيانات وتكوين وعمل المجاميع التي تحيط بالبيانات قد تم الأخذ بها على أنها أمورٌ 
مسلم بهاء في حين أن الاهتمام كان منصبا على المعلومات والمعارف المستقاة dgio‏ فالوقت 
قد حان لتدارك هذا الإهمال. 
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”. عضو الفريق الدولي لدراسة احتياج المهارات الوظيفية. صندوق اموارد البشريه بالتعاون 
AY V-V- VO ojla delo za‏ 
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l n‏ 
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غضو الحم الد 5ة للحكومة الرقمىة 56G.6(‏ 1۲ الان 
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aY AV- ما"٠١١ تنفيذ عدد من الاستشارات للجهات الحكومية بالمملكة العربية السعودية‎ .٠ 

.م٠١١١/-م7٠٠١١ مجال تقنية المعلومات‎ à تصميم وتطوير العديد من البرامج التدريبيه‎ .١١ 

Ww‏ المشاركة فى العديد من المحافل والمؤتمرات المحلية والإقليمية والدولية. 
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مراجع الترجمة في سطور 


د. ماجد بن عبدالعزيز Gud!‏ 
- الدكتوراة في مجال أنظمة المعلومات والتخطيط الإستراتيجي للمنشآتء جامعة سالفورد 
بريطانيا (YAV‏ 


الوظيفة الحالية: 
- أستاذ مساعد بقسم نظم المعلومات - كلية علوم الحاسب والمعلومات - جامعة الإمام 


الخبرات العلمية والعملية: 

- عمل عضو هيئة تدريس بقسم تقنية ال معلومات والاتصالات بكلية املك فهد الأمنية. 

- عمل محاضرا غير متفرغ مركز خدمة المجتمع بجامعة الإمام محمد بن سعود. 

- الإشراف ومناقشة عدد من رسائل ال ماحستير. 

- حضور ونشر عدد من المشاركات العلمية بعدد من المؤتمرات والمجلات العاطية. 

- عمل مستشارا بهيئة الهلال الأحمر السعودىء 7١117‏ - حتى الآن. 

- عضو فرق عمل ضمان الحجودة QSR-International 4. $ ,2J‏ فيما يخص ضمان جودة 
واختبار برمجياتها (NVivo)‏ تطبيق إدارة وتحليل البيانات الوصفة. 

- العمل مستشار لأمانة مدينة الرياض ف تطوير مشروع مركز الاتصال ٠٤١‏ . 

- العمل مع إدارة تقنية المعلومات بالمؤسسة العامة للتقاعد على تحليل بعض المشاكل 
„AI‏ 

- العمل على تطوير أنظمة حاسوبية لشركة القصبي. 

- العمل والإشراف على تطوير عدة أنظمة حاسوبية تطبيقية بكلية الملك فهد الأمنية. 
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- القيام بدراسة تقييم تطبيقات أنظمة المعلومات من حيث النجاح والفشل ومن بينها 
نظام الإسعاف مدينة e VY ele (LASDS). d5l$s 54:J‏ 

- دراسة تحليلية لتطبيق نظام 8128 لإدارة عمل جمعية الهلال الأحمر التركية (11805). 

- القيام بإعداد دورة تدريبيهة خاصة لطلبة الدكتوراة في قسم 1۸15 بجامعة سالفورد فيما 
بخص العمل على نظام التحليل الوصفي للبيانات .NVivo‏ 

- القيام بإعداد دورة تدريبية خاصة لطلبة الدكتوراة في قسم 11815 بجامعة سالفورد فيما 
بخص العمل على نظام الفهرسة الإلكترونيهة EndNote‏ 
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حقوق الطبع والنشر محفوظه لمعهد الإدارة العامة ولا يجوز 
اقتباس جزء من هذا الكتاب أو إعادة طبعه بأية صورة دون موافقة 


كتابية من المعهد إلا في حالات الاقتباس القضير بغرض النقد 
والتحليلء مع وجوب ذكر المصدر. 





تم التصميم والإخراج الفني والطباعة في 
الإدارة العامة للطباعة والنشر بمعهد الإدارة العامة - ۴۳۹٤١ه‏ 


d 
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هدا الكتاب 

ES ag‏ الا ل ced eel‏ ودقيق للبيانات وثورة البيانات الجاربة حاليا 
فالكتاب يسعى. من جهة, لبن سنن لسر و: موس بل المتعلقة بإعادة تشكيل إنتاج ومعالجة 
وخلبل وتبادل البيانات, وما بعني هذا لكبفبة انتاج واستخدام المعلومات والمعرفة: وهو. من 
جهة أخرى. مهد للنقاش والنفكبر النقدى حول البيانات من حبث FAE OTET N‏ 

اا ا FURTO SUE UHR ER] Lem PT‏ 
VY EES‏ وبستند التحليل المقدم في هذا الكتاب الى مشاركة واسعة النطاق وإلى ما 
سشىقه من مؤلفات فى مختلف العلوم. والعلوم الانسانية, والعلوم الاجتماعية. ومن مطبوعات 
النَقَافة الشعبية. والإصدارات الصحافية. والدوربات الصناعية: والى خبرة مباشرة في العمل 
mr‏ أثظمة حفظ dui S. PT "T9 TEN‏ 7ك mcr DAL‏ نطاق n‏ تت IAM‏ 
PEEP ON YET E LIE LE SIE e aua ias‏ الفصل الأول لحة عاأمة ونقذا فكربا حول مقهوم 
السبانأت وكيفبة هم قواعد السانات والبنى التحتية للسيانات, فى حبن ببحث القصل الثاني في 
الدورالمستمرللببانات الصغبرة والكبفبة التي تم بها توسيع نطاقها إلى أرشيفات /محفوظات 


رقمبة وبنى ختبة, الى أن وصلت الى درجة التدأول وبيعها من خلال وسطاء الببانات. كمابناقش ۾ ر - 


الفصل الثالث الدافع للتؤجه تحو استحداث البيانات المفتوحة والببانات المرتبطة ۾ ي 
ESE CIO EEC ETI EEE ELE]‏ ات چ ا ر 
xc LD SITS;‏ ال EES‏ 
e ar en LRL‏ 

المسساعدة على انتشارها. وبِقَدَمْ الفصضل السنادس نحة : EM‏ 
غامة عن مجموعة حديذة من خلبلات السبانات - A.‏ 1 

التي ترمي الى فهم الببانات الصغيرة الموسعه | 0 : 
LE ERECTUS PVT OTC OC OEE‏ | 

z y 4. : Y 0 1 1 000 ل‎ HIN 
e, ١ ريوصت‎ et 5 الكبيرة والترؤيج لها وبيان تأثبرها في‎ 





- AT | T aw" | "a | LES eR الحوكمة والأعمال.‎ 
| ١ ٠١ نقاثورة الببانات لأعادة تشكيل عتفلية‎ 


x 1 urs C y ^ vuU Aui ac soa 


i : `x t. i l hd 9 | 
JR RCRCACDUOTS X ern eh مم‎ 1 "c5. E القصلان التاسع والعاشر التحديات‎ 


TE a O E CODE EOC EO ERST] 
| 4 > 8 والسياسية. والقاثوثنية لثورة‎ 
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